说完之后就开始向周围的地方挖掘文字转WAV音频