工业智能体的数据基础：语义化、上下文与工业现场数据治理

工业智能体要真正进入生产现场，首先要面对的不是模型问题，而是数据问题。

制造企业通常并不缺数据。设备有传感器数据，产线有节拍数据，MES 有工单数据，QMS 有质量数据，WMS 有库存数据，CMMS 有维修数据，ERP 有订单和成本数据，SCADA 或 Historian 中还保存着大量过程趋势数据。

但当企业希望智能体回答“为什么良率下降”“为什么设备频繁停机”“是否可以调整排程”“这个批次是否有风险”时，往往会发现数据并不容易直接使用。原因在于，工业数据天然具有分散、异构、语义复杂和上下文强依赖的特点。

工业智能体如果只是连接数据库，而不能理解数据含义，就只能做浅层查询，很难支撑可靠推理。因此，工业智能体的第一项基础工程，不是搭建问答界面，而是建设可供智能体理解和调用的工业数据底座。

一、工业数据的主要难点

1. 命名不统一

同一台设备，在 MES 中可能叫“Line-3-Machine-02”，在 SCADA 中叫“M302”，在维修系统中叫“CNC-3-2”，现场人员则称其为“三线二号机”。如果没有统一资产映射，智能体很难准确找到对应数据。

2. 指标含义不清

“温度”可能指炉膛温度、模具温度、出料温度、夹套温度或环境温度。不同温度对质量和设备状态的影响完全不同。智能体如果无法理解指标语义，就可能把无关变量当成关键原因。

3. 时间粒度不一致

设备数据可能是秒级，质量检测数据可能是批次级，工单数据可能是小时级，库存数据可能是天级。要分析质量异常，就需要把这些不同粒度的数据按设备、批次和时间窗口对齐。

4. 数据质量不稳定

传感器漂移、数据缺失、异常尖峰、人工录入错误、设备离线、接口延迟，在工业现场非常常见。智能体必须知道哪些数据可信，哪些数据只能作为参考。

5. 上下文缺失

质量问题往往不是由单一变量决定，而是由设备、物料、工艺、环境、人员和计划共同作用产生。没有上下文，智能体只能给出模糊判断。

二、工业智能体需要的数据语义层

为了让智能体真正理解工业现场，需要在原始数据之上构建工业数据语义层。它的目标，是把分散在不同系统中的数据转化为可关联、可查询、可解释、可推理的工业对象。

1. 资产模型

资产模型描述工厂中的物理对象及其关系，包括工厂、车间、产线、工位、设备、部件、传感器、控制点位和备件。

例如，3 号产线包含注塑机、机械手、检测工位和包装工位；注塑机包含液压系统、加热系统、锁模机构和模具；模具又关联温度、压力、冷却水流量等关键点位。

有了资产模型，智能体才能理解“这台设备”“这个工位”“三线模温异常”具体指向哪些数据对象。

2. 工艺模型

工艺模型描述产品如何被制造，包括工序、工艺路线、配方、参数窗口、关键控制点和质量控制点。

例如，一个涂布工艺可能包含放卷、涂布、烘干、冷却、收卷和检测。每道工序都有关键参数，例如涂布速度、浆料粘度、烘箱温度、张力、湿度和膜厚。智能体分析膜厚波动时，必须知道哪些参数属于关键控制点。

3. 质量模型

质量模型描述批次、检测项目、缺陷类型、判定标准、抽检规则和追溯关系。

例如，某批次对应某工单、某物料批次、某产线和某检测标准。质量模型是智能体做质量异常分析、批次追溯和放行建议的基础。

4. 事件模型

事件模型记录生产过程中的关键事件，包括报警、停机、换线、换模、换料、维修、点检、首件确认、参数变更和质量异常。

很多时候，事件比连续数据更能解释问题。例如不良率从下午 2 点开始上升，刚好 1 点 50 分进行了换料，2 点 10 分出现设备报警，这些事件为根因分析提供了重要线索。

5. 权限与责任模型

工业数据并不是所有人都能看、所有人都能改。智能体需要知道用户是谁、属于哪个岗位、拥有何种权限、能访问哪些产线、能发起哪些操作。没有权限模型，智能体容易出现越权访问或越权操作风险。

三、数据语义层如何支撑智能体推理

以电子装配企业的焊接不良为例。假设 A 产品在 2 号产线的焊接不良率从 1.2% 上升到 4.8%，质量工程师询问：

“帮我分析一下 A 产品今天焊接不良率升高的原因。”

如果没有语义层，智能体可能只能查询质量报表，然后回答“可能与设备、物料或工艺参数有关”。

如果已有语义层，智能体可以按以下路径分析：

识别 A 产品的工艺路线。
定位主要缺陷类型，例如虚焊和连焊。
找到 2 号产线对应的焊接设备和检测工位。
确定当天生产批次和时间范围。
追溯锡膏批次和 PCB 批次。
检查当天是否发生换线、换料、设备维护或程序切换。
查询焊接温度曲线、传送速度、锡膏回温时间和环境湿度。
对比历史正常批次和异常批次。
输出候选根因和证据链。

智能体最终可能给出：

今日 10:20 后虚焊占比明显上升，主要集中在 A 产品第 3、4 焊点。
10:05 更换了锡膏批次，且新批次回温记录缺失。
回流焊第 4 温区实际温度在 10:20—11:10 期间低于工艺窗口下限。
建议优先检查锡膏回温记录、第 4 温区温控状态，并隔离相关时间段批次复检。

这样的输出不是泛泛而谈，而是基于语义关联和数据证据形成的工程分析。

四、数据治理应从智能体场景倒推

很多企业做数据治理时，容易追求“大而全”的数据中台，试图一次性打通所有系统、清洗所有数据、建立完整主数据体系。这种方式周期长、投入大，也容易与业务价值脱节。

工业智能体项目更适合采用“场景牵引”的数据治理方式。先明确要解决的业务问题，再倒推所需数据。

如果第一个场景是“设备报警解释”，优先治理：

设备资产编码。
报警代码字典。
报警历史记录。
设备运行状态。
维修记录。
设备手册和处理 SOP。
设备与产线、工单的关联关系。

如果第一个场景是“质量异常分析”，则优先治理：

产品与工艺路线。
工单与批次。
质量检测结果。
缺陷分类。
物料批次。
设备参数趋势。
换线、换模、换料、维修等事件记录。

这种做法能够让数据治理与业务价值形成闭环，避免长期停留在基础平台建设阶段。

五、工业数据接入的技术要点

工业智能体通常需要处理三类数据。

1. 结构化业务数据

来自 MES、ERP、QMS、WMS、CMMS 等系统，包括工单、产品、批次、质量检测、库存、维修工单、设备台账和人员班组。重点是统一主数据和业务口径，而不是简单同步。

2. 时序过程数据

来自 SCADA、Historian、IoT 平台或设备采集系统，包括温度、压力、电流、速度、振动、流量、湿度和能耗等。智能体通常不应直接读取大量原始曲线，而应先生成摘要特征，例如最大值、最小值、均值、波动范围、超限时长和异常时间段。

3. 非结构化文档数据

包括 SOP、设备手册、维修说明、工艺规范、质量标准和历史问题报告。适合用 RAG 处理，但必须保留文档版本、适用范围、生效日期、审批状态和权限等级，避免引用过期或不适用内容。

六、让智能体知道“不知道”

工业智能体不应假设所有数据都是完整和正确的。它必须具备数据质量感知能力。

例如，在分析设备异常时，如果关键传感器离线，智能体应明确提示：“当前缺少主轴温度数据，无法判断温升是否为主要原因。”在分析质量异常时，如果物料批次追溯缺失，应提示：“无法确认异常是否与物料批次变化有关。”

这种“不确定性表达”非常重要。工业现场宁可让智能体保守提示数据不足，也不能让它基于不完整数据给出确定结论。

结语

工业智能体的能力上限，首先取决于工业数据底座的质量。没有统一资产模型、工艺模型、质量模型、事件模型和权限模型，智能体只能做局部问答，很难支撑跨系统推理和生产决策。

制造企业建设工业智能体，不应从“接入大模型”开始，而应从“让生产数据可理解、可关联、可追溯”开始。数据语义化不是额外工作，而是工业智能体从演示走向生产可用的必经之路。

评论取消回复

本文目录

工业智能体
生产计划与排产智能体：提升交付和产能利用率
发布：2026-04-24
思捷洞察
大模型如何重塑法律行业：从效率工具到法律服务新范式
发布：2026-05-18
思捷洞察
别让“老古董”拖垮利润：传统制造企业如何极低成本拥抱工业AI？
发布：2026-03-07

工业智能体的数据基础：语义化、上下文与工业现场数据治理

工业智能体的数据基础：语义化、上下文与工业现场数据治理

一、工业数据的主要难点

二、工业智能体需要的数据语义层

三、数据语义层如何支撑智能体推理

四、数据治理应从智能体场景倒推

五、工业数据接入的技术要点

六、让智能体知道“不知道”

结语

评论取消回复

订阅接收最新信息

本文目录

相关文章

生产计划与排产智能体：提升交付和产能利用率

大模型如何重塑法律行业：从效率工具到法律服务新范式

别让“老古董”拖垮利润：传统制造企业如何极低成本拥抱工业AI？

联系信息：

工业智能体的数据基础：语义化、上下文与工业现场数据治理

工业智能体的数据基础：语义化、上下文与工业现场数据治理

一、工业数据的主要难点

二、工业智能体需要的数据语义层

三、数据语义层如何支撑智能体推理

四、数据治理应从智能体场景倒推

五、工业数据接入的技术要点

六、让智能体知道“不知道”

结语

评论 取消回复

订阅接收最新信息

本文目录

相关文章

生产计划与排产智能体：提升交付和产能利用率

大模型如何重塑法律行业：从效率工具到法律服务新范式

别让“老古董”拖垮利润：传统制造企业如何极低成本拥抱工业AI？

联系信息：

评论取消回复