再把音轨整理一遍文字转WAV音频