当然谈话的过程中如果出现什么误解文字转WAV音频