但是在第三阶段文字转WAV音频