为了便于模拟未来的拍摄现场文字转WAV音频