就是通过不同文化的碰撞文字转WAV音频