他觉得这件事不能单纯的否定文字转WAV音频