只吸收了极少一部分文字转WAV音频