这是一个近乎绝望的估算文字转WAV音频