慢条斯理地进行识别文字转WAV音频