然后让系统自己运算总分文字转WAV音频