由于他们的估计失误文字转WAV音频