但是他从其表情的细微变化上能判断出文字转WAV音频