可是再去捕捉文字转WAV音频