不断与截图信息对比着文字转WAV音频