看能不能从他们的嘴里知道文字转WAV音频