而且还和他们进行对话文字转WAV音频