双方从质量上就完全是不一样的文字转WAV音频