
工业智能体要真正进入生产现场,首先要面对的不是模型问题,而是数据问题。
制造企业通常并不缺数据。设备有传感器数据,产线有节拍数据,MES 有工单数据,QMS 有质量数据,WMS 有库存数据,CMMS 有维修数据,ERP 有订单和成本数据,SCADA 或 Historian 中还保存着大量过程趋势数据。
但当企业希望智能体回答“为什么良率下降”“为什么设备频繁停机”“是否可以调整排程”“这个批次是否有风险”时,往往会发现数据并不容易直接使用。原因在于,工业数据天然具有分散、异构、语义复杂和上下文强依赖的特点。
工业智能体如果只是连接数据库,而不能理解数据含义,就只能做浅层查询,很难支撑可靠推理。因此,工业智能体的第一项基础工程,不是搭建问答界面,而是建设可供智能体理解和调用的工业数据底座。
一、工业数据的主要难点
1. 命名不统一
同一台设备,在 MES 中可能叫“Line-3-Machine-02”,在 SCADA 中叫“M302”,在维修系统中叫“CNC-3-2”,现场人员则称其为“三线二号机”。如果没有统一资产映射,智能体很难准确找到对应数据。
2. 指标含义不清
“温度”可能指炉膛温度、模具温度、出料温度、夹套温度或环境温度。不同温度对质量和设备状态的影响完全不同。智能体如果无法理解指标语义,就可能把无关变量当成关键原因。
3. 时间粒度不一致
设备数据可能是秒级,质量检测数据可能是批次级,工单数据可能是小时级,库存数据可能是天级。要分析质量异常,就需要把这些不同粒度的数据按设备、批次和时间窗口对齐。
4. 数据质量不稳定
传感器漂移、数据缺失、异常尖峰、人工录入错误、设备离线、接口延迟,在工业现场非常常见。智能体必须知道哪些数据可信,哪些数据只能作为参考。
5. 上下文缺失
质量问题往往不是由单一变量决定,而是由设备、物料、工艺、环境、人员和计划共同作用产生。没有上下文,智能体只能给出模糊判断。
二、工业智能体需要的数据语义层
为了让智能体真正理解工业现场,需要在原始数据之上构建工业数据语义层。它的目标,是把分散在不同系统中的数据转化为可关联、可查询、可解释、可推理的工业对象。
1. 资产模型
资产模型描述工厂中的物理对象及其关系,包括工厂、车间、产线、工位、设备、部件、传感器、控制点位和备件。
例如,3 号产线包含注塑机、机械手、检测工位和包装工位;注塑机包含液压系统、加热系统、锁模机构和模具;模具又关联温度、压力、冷却水流量等关键点位。
有了资产模型,智能体才能理解“这台设备”“这个工位”“三线模温异常”具体指向哪些数据对象。
2. 工艺模型
工艺模型描述产品如何被制造,包括工序、工艺路线、配方、参数窗口、关键控制点和质量控制点。
例如,一个涂布工艺可能包含放卷、涂布、烘干、冷却、收卷和检测。每道工序都有关键参数,例如涂布速度、浆料粘度、烘箱温度、张力、湿度和膜厚。智能体分析膜厚波动时,必须知道哪些参数属于关键控制点。
3. 质量模型
质量模型描述批次、检测项目、缺陷类型、判定标准、抽检规则和追溯关系。
例如,某批次对应某工单、某物料批次、某产线和某检测标准。质量模型是智能体做质量异常分析、批次追溯和放行建议的基础。
4. 事件模型
事件模型记录生产过程中的关键事件,包括报警、停机、换线、换模、换料、维修、点检、首件确认、参数变更和质量异常。
很多时候,事件比连续数据更能解释问题。例如不良率从下午 2 点开始上升,刚好 1 点 50 分进行了换料,2 点 10 分出现设备报警,这些事件为根因分析提供了重要线索。
5. 权限与责任模型
工业数据并不是所有人都能看、所有人都能改。智能体需要知道用户是谁、属于哪个岗位、拥有何种权限、能访问哪些产线、能发起哪些操作。没有权限模型,智能体容易出现越权访问或越权操作风险。
三、数据语义层如何支撑智能体推理
以电子装配企业的焊接不良为例。假设 A 产品在 2 号产线的焊接不良率从 1.2% 上升到 4.8%,质量工程师询问:
“帮我分析一下 A 产品今天焊接不良率升高的原因。”
如果没有语义层,智能体可能只能查询质量报表,然后回答“可能与设备、物料或工艺参数有关”。
如果已有语义层,智能体可以按以下路径分析:
- 识别 A 产品的工艺路线。
- 定位主要缺陷类型,例如虚焊和连焊。
- 找到 2 号产线对应的焊接设备和检测工位。
- 确定当天生产批次和时间范围。
- 追溯锡膏批次和 PCB 批次。
- 检查当天是否发生换线、换料、设备维护或程序切换。
- 查询焊接温度曲线、传送速度、锡膏回温时间和环境湿度。
- 对比历史正常批次和异常批次。
- 输出候选根因和证据链。
智能体最终可能给出:
- 今日 10:20 后虚焊占比明显上升,主要集中在 A 产品第 3、4 焊点。
- 10:05 更换了锡膏批次,且新批次回温记录缺失。
- 回流焊第 4 温区实际温度在 10:20—11:10 期间低于工艺窗口下限。
- 建议优先检查锡膏回温记录、第 4 温区温控状态,并隔离相关时间段批次复检。
这样的输出不是泛泛而谈,而是基于语义关联和数据证据形成的工程分析。
四、数据治理应从智能体场景倒推
很多企业做数据治理时,容易追求“大而全”的数据中台,试图一次性打通所有系统、清洗所有数据、建立完整主数据体系。这种方式周期长、投入大,也容易与业务价值脱节。
工业智能体项目更适合采用“场景牵引”的数据治理方式。先明确要解决的业务问题,再倒推所需数据。
如果第一个场景是“设备报警解释”,优先治理:
- 设备资产编码。
- 报警代码字典。
- 报警历史记录。
- 设备运行状态。
- 维修记录。
- 设备手册和处理 SOP。
- 设备与产线、工单的关联关系。
如果第一个场景是“质量异常分析”,则优先治理:
- 产品与工艺路线。
- 工单与批次。
- 质量检测结果。
- 缺陷分类。
- 物料批次。
- 设备参数趋势。
- 换线、换模、换料、维修等事件记录。
这种做法能够让数据治理与业务价值形成闭环,避免长期停留在基础平台建设阶段。
五、工业数据接入的技术要点
工业智能体通常需要处理三类数据。
1. 结构化业务数据
来自 MES、ERP、QMS、WMS、CMMS 等系统,包括工单、产品、批次、质量检测、库存、维修工单、设备台账和人员班组。重点是统一主数据和业务口径,而不是简单同步。
2. 时序过程数据
来自 SCADA、Historian、IoT 平台或设备采集系统,包括温度、压力、电流、速度、振动、流量、湿度和能耗等。智能体通常不应直接读取大量原始曲线,而应先生成摘要特征,例如最大值、最小值、均值、波动范围、超限时长和异常时间段。
3. 非结构化文档数据
包括 SOP、设备手册、维修说明、工艺规范、质量标准和历史问题报告。适合用 RAG 处理,但必须保留文档版本、适用范围、生效日期、审批状态和权限等级,避免引用过期或不适用内容。
六、让智能体知道“不知道”
工业智能体不应假设所有数据都是完整和正确的。它必须具备数据质量感知能力。
例如,在分析设备异常时,如果关键传感器离线,智能体应明确提示:“当前缺少主轴温度数据,无法判断温升是否为主要原因。”在分析质量异常时,如果物料批次追溯缺失,应提示:“无法确认异常是否与物料批次变化有关。”
这种“不确定性表达”非常重要。工业现场宁可让智能体保守提示数据不足,也不能让它基于不完整数据给出确定结论。
结语
工业智能体的能力上限,首先取决于工业数据底座的质量。没有统一资产模型、工艺模型、质量模型、事件模型和权限模型,智能体只能做局部问答,很难支撑跨系统推理和生产决策。
制造企业建设工业智能体,不应从“接入大模型”开始,而应从“让生产数据可理解、可关联、可追溯”开始。数据语义化不是额外工作,而是工业智能体从演示走向生产可用的必经之路。







京公网安备 11010802034617号