但依然保留了一定的自主性文字转WAV音频