水平参差不齐导致文字转WAV音频