就是先通过超量的理论计算文字转WAV音频