目前看来确实是浪费文字转WAV音频