核心区域的时间就可以了文字转WAV音频