并不能单纯的用修为高低来划分文字转WAV音频