密集的人群自动分向两边文字转WAV音频