所以他不会考虑这个问题文字转WAV音频