进行完这一轮的人文字转WAV音频