后期的主线文字转WAV音频