毕竟截过之后还要收边文字转WAV音频