最后他们选择了沉默文字转WAV音频