再结合之前实况转播里面的那些画面文字转WAV音频