所以他们选择的是多坐传送阵文字转WAV音频