当初为了能够抓到文字转WAV音频