没有用肉眼去捕捉文字转WAV音频