捕捉到一些什么文字转WAV音频