因为我们无法得出具体的参数文字转WAV音频