更多的是在打探周围文字转WAV音频