他自己分析了一下文字转WAV音频