在技能结束前文字转WAV音频