但控制媒体不是那么简单的文字转WAV音频