然后不断延伸叠加文字转WAV音频