要先用感知探查文字转WAV音频