然后再把位置和人选拿出来掂量掂量文字转WAV音频