尤其要增加谈话环节文字转WAV音频