肯定是要加上录音室的音轨的文字转WAV音频