但实际上他并不需要这么做的文字转WAV音频