而后面的最终考核又能通过文字转WAV音频