而且他们谈话的内容都是文字转WAV音频