整体框架都要被斜斜抽断文字转WAV音频