从两人穿戴的服装上的图案来看文字转WAV音频