但起码这是一个可以量化文字转WAV音频