然后各自的穿着衣服文字转WAV音频