每个人的位置都是随机的文字转WAV音频