所以才必须要回答文字转WAV音频