这回估计是要分离文字转WAV音频