正是一个常规的划分文字转WAV音频