所以他们还是要进行询问文字转WAV音频