只是在对方质问的眼神下文字转WAV音频