当他看到目标时文字转WAV音频