然后他们一左一右向人群中间冲去文字转WAV音频