最后在三种女子中选出最有可能的一种文字转WAV音频