其实是感官的直接刺激文字转WAV音频