所以他们能够感应到彼此文字转WAV音频