精准地判断着每一个猎物的动作文字转WAV音频