当然不可能有什么长期目标文字转WAV音频