然后从结果强行倒推过程文字转WAV音频