训练量开始加重文字转WAV音频