类似的对话几乎有成千上万――很显然文字转WAV音频