这就是人与人之间的不同文字转WAV音频