所以围观群众也分成了两拨文字转WAV音频