其他两个则是在人质中搜身文字转WAV音频