不同的只是形态文字转WAV音频