但是这样的决策也有个弊端文字转WAV音频