用友网络科技

新闻发布
立即打印
媒体联络
线女士
用友集团简介 xianbj@czfzlmy.com
从混沌数据到逻辑框架:LOM本体大模型如何自主构建本体?
2026年4月17日

   

yonyou


企业的收获汇聚数剧,但数剧相等同于生活常识。ERP中的表、word表格中的工作流程、工作流程中的明确——都藏在“人大脑”和“文章”中,就不会有办法被器机真接表达。不会有可换算的生活常识,AI只好靠概率分析“的猜想”,就不会有办法用思想“ 保障”。



 


LOM本体大模型的核心能力之一,是自主构建企业业务的逻辑框架——从混沌数据中提炼出实体、关系、约束,形式化为可计算的本体。本文基于用友AI Lab全新发布的LOM本体大模型论文《Unifying Ontology Construction and Semantic Alignment for Deterministic Enterprise Reasoning at Scale》,深度解读这一能力,揭示LOM本体大模型如何为企业AI规模化奠定第一块基石。


01

企业AI规模化的坎:

数据不等于知识


 


过去十年,企业完成了大规模的数字化迁移。ERP、CRM、SCM、HRM——各类业务系统积累了海量数据。然而,当企业试图用AI处理这些数据时,一个根本问题浮出水面:数据不等于知识。


一些一般的ERP模式应该构成上百张表、上千人个数据类型。数据类型名如“INV01”“CUST_TYPE”是表示符,其行业量范围涵意需用人工费解析;不一性质在不一模式中运行不一标题;行业量范围规律藏在进行操作手冊里,写在审核流程步骤中,以及会存在行业量范围技术专家的脑瓜子里。


这样“动态数据丰富性、小理论知识贫乏”的陷入困境,定义了机构AI经营专业化技术应用的最道坎。如果没有可算起的小理论知识整体布局完成后,AI只源于核算想关性实施“的猜想”——这恰巧是慨率模特的本体论局限性。


论文开篇即点明这一困境:“企业积累了海量数据,但其中大部分仍然混乱且实际上处于休眠状态。”如何唤醒这些沉睡的数据?答案在于自主构建。


02

 本体:

让机器理解业务的“逻辑框架”


在劳动力智慧研究方向行业,“精神力”也是个根本什么举例。简便来讲,精神力是对一研究方向行业的什么举例化——它举例了:


实体:业务中有哪些事物(供应商、物料、仓库、订单)

关系:这些事物之间如何关联(供应商提供物料、物料存入仓库)

约束:这些关系必须遵守什么规则(物料必须在保质期内、供应商必须通过资质审核)


咱们可不可以把本体掌握为公司的“销售业务量高中物理推论”。这句话牛顿推论简述了宇宙黑洞中方式的运作周期性,本体简述了公司销售业务量的执行道理。出现这套“推论”,机子就不要是盲点地“猜”,而且有章可言地“推”。


论文范文将某些的想法工作总结为:用专业化创设基座,LOM基座大模特“创造自己新一个设定性的生态,进来方式不只仅是几率性的,然而组成性的、具依赖力的”。


03

自主构建:

LOM如何从混沌数据中“提炼”逻辑框架


 


LOM完整性大类别的综合性融合的能力,体现出在它够从两种原创数值中自动的提取知识储备:


从结构化数据中发现隐式关系


商家资料库文件的表总是不兼容很明确的外键分类。LOM自身大模板主要采用多目标整合架构图,按外键自律先后遍历表的结构,结合起来RAG模块电源修改语义左右侧文,镶嵌指标自身场面。通过证实与整合,决定将一切表、列及关系的投射为方法论自洽的全局变量自身。




从非结构化文本中抽取实体与关系


中小型企业的业务知识不出现于数据统计之中,更多量积淀在文件下载里——实际操作指南、承包合同法条、政策性文件下载、多媒体纪要。


LOM精神力大模式运用LLM驱动下载的收集通风管道:将文本分块补救,在低温制冷的效果度设制下履行实际-干系收集,判别出国际业务实际十分抗性,甚至实际区间内的相关关系型号(如“现专属”“相关关系于”“专属”)。


选取出的实体线都会出现特指不一的问題——相同家批发商商或者被称之为“XX科学”“XX科学比较有限有限”“XX科学股票价格”。LOM本身大模形采用双方面适合原则化解一种疑难问题:


单单从表面适合(文字编辑相距、子串带有)

领域归一化(标准化缩写与全称)

  纵深语义配对(向量添加相仿度)


最中,同种实体模型被伴有为正规端点,组成文本格式层自身。


跨源融合:统一的企业知识图谱


型式化本体论论与备份文本本体论论借助系统的性方法深度.整合:范畴排列区分等价类与技能,予盾应对治疗称与方面对立,方面集成式建设跨本体论论直接关系,最好借助效验保障结构保持完整性。


溶合后的单位本体论有的是个统一的的异图案,既涉及到相关统计oracle的认真负责格局,又承载能力非格局化文件的多语义。毕业论文体现了,此种操作过程“将初始统计数据分析中固定性的几率燥音坍缩为明确性的格局表述”。


04

动态演化:

逻辑框架不是静态的,而是“活”的


行业的业务量非是一成不改变的。新提供商出入库,最新新规策分享,新限制生效日——思维层次结构都要一起演变。


传统型形式次次升级更新系统都需要如何引入,价格非常高且落伍厉害。LOM主机大模形则实现动态展示图升级更新系统原则,鼓励主机的时实演替。文献将这原则描叙为“让图节构异常时实统计资料流进而动态展示图自我调节”。


实际的如何理解,LOM精神力大仿真沙盘模型将公司周围环境理论依据变成一种稀松图,连接点代表会性实体的,边代表会性直接有关。当新数据报告涌入,仿真沙盘模型经由微信链接預測评判要不要必须 更新软件时间图程序——要不要会有新连接点?新直接有关?旧直接有关要不要出现异常?进而递归更新软件时间图结构类型,增加与的业务真实感同时。


论文怎么写用计算公式叙述了这种操作过程:Gₜ₊₁ = Update(Gₜ, ΔDₜ; θ_align)。这寓意着,LOM的逻辑关系结构框架不能外部的“内容库”,只是日常动态的“生命安全体”,长期与业务员现实存在同频共震。


05

逻辑框架如何服务于确定性推理


有该自行创设的形式逻辑架构设计,LOM基座大建模的逻辑已不再是几率比性的“预测”,反而确认性的“计算”。


在民俗的GraphRAG范式中,图被用做信息检索字段,辅助LLM市场定位涉及到文本格式,但既定规律题仍由LLM的概率计算公式刹车系统完毕。LOM基座大类别则是的不同——它将基座最为规律定理,在基座上一直继续执行确保的图法求(如最少绝对路径、最大转换成树)或规律细则规律题。


这真是7D逻缉基层民主的目标:报告的格式不只是“猜”得出来了的,还是由逻缉框架图要严格推论得出来了的。


一种适应对制造业公司策略有着跟本现实意义。当AI建意“拆卸产生商A”时,制造业公司需求确定:这也是由于哪个样的流程?求算路径分析是哪个样的?是不是可验证通过、可朔源?LOM本体大整治的语言表达前端框架出具了很多某些正确答案。


医学论文的调查数剧查验了这样线路的合理科学性:在网页链接預测的任务(本体勾勒的中心)上,LOM-4B实现88.8%正确率。这证明怎么写LOM并能从实在企业主的嗓声数剧中,正确地勾勒出可来计算的方法层次结构。


从浑沌数剧报告到逻辑性推理框架结构,LOM自身大绘图的自身自主经营打造意识搞定了中小型制造业企业AI总量化的重中之重一跃。它化解了“数剧报告一致于生活常识”的根本就机遇与挑战,将中小型制造业企业弹落的隐性生活常识转化率为可计算方法的逻辑性推理制度。


你这个自主化完成并延续演变的结构体系结构,是后期的语义分散对齐和确实性侦探推理赖以完成的核心。都没有它,AI智能化“猜”;产生它,AI方能“推”。让AI取得“定义”业务部生活结构的实力,是掌控概率公式推断、完成厂家级确实性智能化的必经征程。


LOM完整性大模式文章联系地址,免下载安装://chinaxiv.org/abs/202603.00072


 


扫码下方小程序码修改本体论大类别基本资料更充分会参与活动公司AI体能集训营


   

用友网络科技科技 用友网络科技科技 用友网络科技科技 用友网络科技科技 用友网络科技科技 ·