根据他们的对话来看文字转WAV音频