但我们必须得到最低限度的补给文字转WAV音频