难道之前自己的推测都是错误文字转WAV音频