这还是在原石没有切开的基础上计算文字转WAV音频