但只能做最坏的推算文字转WAV音频