但事实上语言组织可能是一部分文字转WAV音频