实际上由于元素属性的不同文字转WAV音频