所以才会出声询问文字转WAV音频