发声系统只承载了不到一半的信息量文字转WAV音频