就是让他们选择一个屈服的对象文字转WAV音频