那就必须等到训练完毕文字转WAV音频