看样子是这个方案基本上就算是作废了文字转WAV音频