如果真的是捕捉文字转WAV音频