根据模糊的感应文字转WAV音频