从比赛中推导出训练中得失文字转WAV音频