如果能够抓到的文字转WAV音频