因为就算主动认输文字转WAV音频