这样的扫描当然不可能很细致文字转WAV音频