应该放在第二阶段文字转WAV音频