最后确定最有嫌弃的两位对象文字转WAV音频