说出的第一句话均是对其做进一步的核实和追问文字转WAV音频