你怎么确定就是捕捉文字转WAV音频