来推断出人质的具体位置文字转WAV音频