所以他们只觉得是以少胜多文字转WAV音频