既然没有办法让两者分离文字转WAV音频