同时放大的感知清晰看到门后面站着两个人文字转WAV音频