他先是以感知探查了一遍文字转WAV音频