芥末
发布于 2026-02-23 / 0 阅读
0
0

企业级上下文工程从上下文图谱到 UCL

企业落地 AI(人工智能)时,经常会遇到一个反直觉的问题:模型越来越强,项目成功率却没有同步提高。

很多失败并不是因为大语言模型不会推理,而是因为模型拿到的上下文是混乱的。客户信息在 CRM,订单状态在 ERP,事件记录在 ITSM,流程痕迹在流程挖掘系统,文档又散落在知识库和网盘里。智能体看似能调用工具、检索资料、生成建议,但它没有一个可靠的上下文基座来回答几个关键问题:

  • 当前业务对象到底是谁?
  • 相关证据来自哪里,是否可信?
  • 这个动作是否允许执行?
  • 如果写回系统,怎么审计、回滚和追责?
  • 这次处理产生的新知识,能不能沉淀给下一次使用?

上下文工程(Context Engineering)要解决的正是这些问题。它不只是把提示词写得更好,也不只是把文档塞进向量数据库,而是把模型推理时需要的一切信息,变成可设计、可评估、可治理、可复用的工程系统。

统一上下文层 UCL(Unified Context Layer)可以理解为企业级上下文工程的一种核心架构。它把上下文图谱、权限治理、上下文编译、情境分析、工具调用、证据账本和运行时学习放在同一个受控基座里,让智能体不只是“回答问题”,而是能在企业规则内推理、决策、行动和学习。


1. 上下文工程到底是什么

上下文工程是对大语言模型推理时所接收信息的系统化设计。这里的“上下文”不只包括用户输入,还包括:

上下文类型例子作用
系统指令角色、边界、输出格式约束模型行为
对话历史用户之前问过什么、系统之前回答过什么保持连续性
检索内容文档片段、数据库记录、知识库条目提供事实依据
业务对象客户、订单、合同、供应商、资产、工单让模型知道正在处理什么
工具定义API schema、函数参数、可调用动作让模型能行动
权限策略谁能看什么、谁能改什么、什么动作要审批防止越权
输出约束JSON schema、引用要求、置信度字段方便系统接收结果
审计证据输入、检索结果、决策理由、工具调用记录支持追踪和复盘

如果把大语言模型看成一种新的计算单元,模型本身像处理器,上下文窗口像工作内存。模型每次推理能做出什么结果,很大程度上取决于工作内存里放了什么、怎么组织、哪些信息被赋予更高优先级、哪些信息被屏蔽。

普通提示词工程关注的是“怎么问”。上下文工程关注的是“模型在回答或行动前,应该看到什么、相信什么、遵守什么、记录什么”。

flowchart LR
    A[用户任务] --> B[上下文工程层]
    C[(业务系统)] --> B
    D[(知识库)] --> B
    E[(权限与策略)] --> B
    F[(历史记忆)] --> B
    B --> G[上下文包]
    G --> H[LLM / 智能体]
    H --> I[回答 / 决策 / 工具调用]
    I --> J[(证据账本与学习回写)]
    J --> B

这个流程里,模型并不直接面对所有原始数据。上下文工程层会把分散的数据、权限、证据和工具能力编译成一个上下文包,再交给模型使用。


2. 为什么“多给上下文”不够

很多 RAG(Retrieval-Augmented Generation,检索增强生成)系统失败,并不是因为没有检索,而是因为检索结果无法支持可靠行动。

常见做法是:用户提问后,系统从向量库里取出若干段相似文本,拼进提示词,让模型生成答案。这种方式适合问答,但放到企业流程里会暴露明显短板:

问题表现后果
检索片段缺少结构只知道某段文字相似,不知道它对应哪个客户、合同、订单模型无法稳定推理
权限没有进入上下文用户能问到不该看的内容,或模型调用了不该调用的工具安全风险
证据不可追踪模型回答看起来合理,但无法证明依据难以审计
写回无约束智能体可以建议动作,却不能安全执行动作只能停留在 Copilot
学习不能沉淀每次处理完都丢失经验系统长期不进步

更深层的问题是“理解”和“生成行动”之间存在差距。模型可能能理解复杂材料,却未必能把理解转化成一个正确、合规、可执行的业务动作。比如模型能读懂一份采购合同,也能看懂发票匹配失败的原因,但它还需要知道:

  • 当前供应商是否允许自动豁免?
  • 这类差异金额是否超过审批阈值?
  • 历史上类似情况怎么处理?
  • 应该改采购订单、重新开票,还是发起争议?
  • 哪个动作会影响财务关账?
  • 执行动作后如何记录证据?

所以,企业级上下文不能只是“更多文本”,而要变成结构化、可验证、可执行的上下文系统。


3. 上下文图谱为什么重要

上下文图谱(Context Graph)是把企业上下文组织成图结构的一种方式。图中通常包含实体、关系、事件、证据和决策痕迹。

flowchart LR
    S[供应商 Supplier] -->|交付| O[采购订单 PO]
    O -->|对应| I[发票 Invoice]
    O -->|受约束于| C[合同 Contract]
    I -->|触发| E[三方匹配异常]
    E -->|参考| P[采购政策 Policy]
    E -->|历史相似| H[历史处理案例]
    E -->|产生| D[处理决策]
    D -->|写入| L[证据账本]

和普通文本检索相比,图谱至少带来三类价值。

3.1 结构比字符串更适合推理

字符串检索只能告诉模型“这段话可能相关”。图谱可以告诉模型:

  • 这个发票属于哪个订单;
  • 订单对应哪份合同;
  • 合同里有哪些付款条款;
  • 供应商过去是否多次延期;
  • 这次异常和哪些历史决策相似;
  • 哪些政策限制了自动处理。

模型面对的不再是一堆段落,而是一组带关系的业务事实。

3.2 决策痕迹可以沉淀为资产

企业最有价值的上下文不只是“现在有什么数据”,还包括“过去为什么这么处理”。例如:

  • 哪些异常曾经被批准?
  • 哪些告警后来证明是误报?
  • 哪些供应商在什么条件下可以自动豁免?
  • 哪些客户投诉需要人工升级?
  • 哪些变更导致过重大事故?

这些信息如果只留在邮件、会议纪要或工单评论里,智能体很难复用。放进上下文图谱后,过去的决策就能成为下一次推理的证据。

3.3 跨域关系能够暴露隐性风险

单个系统往往只能看到局部事实。跨图谱分析才能发现更复杂的问题。

举个例子:

  • 身份安全图谱记录:过去 127 次来自新加坡的登录告警被关闭为误报,置信度 0.94。
  • 威胁情报图谱记录:近期新加坡 IP 段的凭证填充攻击增长 340%。

单独看这两条信息,都不一定触发高优先级事件。合在一起看,就可能说明误报规则已经过时,需要重新校准风险模型。

这类发现依赖共享实体、统一语义和可遍历的元图。只有把多个业务域接到同一个上下文基座,智能体才有机会发现跨域信号。


4. 只有上下文图谱还不够

把企业元数据导入图数据库,并不会自动产生可生产化的智能体。图谱解决的是“上下文如何表示”,但企业级智能体还要解决“谁来消费、谁来修改、谁来控制行动”。

可以把问题拆成四层。

层次需要解决的问题只有图数据库时的缺口
读取智能体如何遍历图谱、选择证据、构造推理上下文图里有数据,但不知道该取哪些
决策当前情况该推荐、审批、执行还是升级图数据库不负责情境判断
写回新关系、新案例、新决策如何沉淀缺少运行时演进机制
行动工具调用如何受控、审计、回滚缺少激活和治理闭环

真正的自主智能体至少需要三种能力:

  1. 消费结构:能读取上下文图谱,把图结构转成任务相关的上下文包。
  2. 变异操作:能在运行后更新图谱,例如合并实体、添加关系、记录新案例。
  3. 受控激活:能在权限、审批、回滚、证据账本约束下调用业务系统。

没有这些能力,上下文图谱会停留在“高级知识库”阶段,无法支撑企业流程自动化。


5. 现有架构路线的能力边界

企业 AI 生态里已经出现了几种常见路线:MCP、ADK、ACE、上下文图谱。它们都解决了一部分问题,但侧重点不同。

5.1 MCP:解决连接问题

MCP(Model Context Protocol,模型上下文协议)提供统一协议,让 AI 应用连接外部工具和数据源。它的价值在于降低集成成本,避免每个模型应用都为每个系统单独写适配器。

适合解决的问题:

  • AI 应用如何调用数据库、搜索、代码仓库、业务 API;
  • 不同工具如何用统一方式暴露给模型;
  • 连接器生态如何复用。

不足也很明显:MCP 让智能体“连得上”,但不保证它“理解得对、做得安全、写得可审计”。连接不是治理,工具可见也不等于动作可执行。

5.2 ADK:把上下文看成编译结果

ADK(Agent Development Kit,智能体开发工具包)类框架通常强调把上下文从原始源编译成模型可用视图。它关注成本、延迟、信号衰减和推理漂移。

适合解决的问题:

  • 如何把多源信息整理成模型输入;
  • 如何控制上下文窗口大小;
  • 如何让智能体运行路径更稳定。

它的短板在于:编译视图能让模型看到更好的上下文,但如果缺少企业流程、权限、写回、审计和激活机制,智能体仍然更像一个推荐系统,而不是能闭环处理业务的执行系统。

5.3 ACE:让智能体自我改进

ACE(Agent Context Engineering,智能体上下文工程)强调让智能体通过生成、反思、策展等循环改进自己的 Playbook,也就是任务处理手册。

适合解决的问题:

  • 智能体如何根据执行结果调整策略;
  • 如何降低适应新任务的延迟;
  • 如何让经验沉淀到下一次运行。

问题在于:自我改进需要高质量企业上下文作为燃料。如果智能体只在孤立环境里优化 Playbook,而没有接入 ERP、ITSM、EDW、流程挖掘、权限策略和证据账本,它改进的可能只是局部行为,未必符合企业真实流程。

5.4 能力对比

企业上下文工程能力矩阵

能力矩阵的核心信息是:单点架构通常只覆盖连接、编译、学习或图谱存储中的某一部分,而企业级智能体需要把这些能力连成一个闭环。

架构路线强项主要缺口
MCP标准化连接工具和数据源缺少语义治理、情境分析、受控激活
ADK上下文编译、运行路径规范缺少跨流程融合和企业级写回闭环
ACEPlaybook 自改进缺少企业上下文基座和治理对象
上下文图谱结构化表达企业知识和决策痕迹缺少消费、变异、激活系统
UCL统一上下文、治理、推理、行动、学习架构复杂度更高,需要分阶段建设

UCL 的定位不是替代所有技术,而是把这些能力放到同一个企业上下文基座中。MCP 可以成为连接层的一部分,图数据库可以承载上下文图谱,RAG 可以作为检索手段,ACE 式循环可以用于运行时学习;UCL 负责把它们组织成可治理的生产架构。


6. 什么样的上下文工程才算企业级

企业级上下文工程至少要具备七个维度。少了其中任意一个,系统都很容易退化成“能演示、难生产”的 AI 应用。

维度要解决的问题缺失后的风险
多源融合ERP、EDW、ITSM、流程挖掘、文档系统如何统一接入智能体只能看到局部事实
统一语义客户、订单、供应商、资产等实体如何统一定义同名不同义、同物不同名导致推理错误
上下文图谱实体、关系、事件、证据、决策如何结构化检索结果碎片化,无法推理
上下文产品化上下文包如何版本化、测试、评估不知道模型输入质量是否达标
控制平面权限、策略、血缘、隐私、职责分离如何执行越权访问和合规风险
情境分析系统如何判断当前情况、评分风险、选择动作智能体只能按脚本走,遇到新情况就升级
受控激活写回、审批、回滚、审计、证据账本如何闭环无法安全执行真实业务动作

企业级要求的重点不在“有没有 AI”,而在“AI 是否可以进入关键业务流程”。一旦智能体能改订单、关工单、触发财务动作、调整供应链计划,治理、证据和回滚就不再是附加功能,而是基础设施。


7. UCL 的核心架构

UCL(Unified Context Layer,统一上下文层)位于企业系统和 AI 消费端之间。它既不是单纯的数据湖,也不是单纯的向量库,而是一个把数据、语义、策略、工具和证据统一起来的上下文运行层。

上下文工程基座服务多个 Copilot

图中表达的是“一套受控上下文基座,服务多个自主 Copilot”的架构思想。重大事件响应、服务台分类、访问履行、财务关账、供应链救援、采购差异处理等场景,不应该各自重复建设上下文系统,而应该共享同一个语义和治理底座。

可以把 UCL 拆成五个平面理解。

flowchart TB
    subgraph Consumers[消费端]
        BI[BI 分析]
        ML[机器学习模型]
        RAG[RAG 问答]
        Agents[AI 智能体]
        Automation[业务自动化]
    end

    subgraph UCL[统一上下文层 UCL]
        SA[情境分析平面\n风险评分 / 路由 / 决策]
        CP[控制平面\n权限 / 策略 / 评估 / 血缘]
        MP[元数据与语义平面\n实体 / 关系 / 上下文图谱]
        DP[数据与服务平面\n连接器 / 事件 / API / 文档]
        AP[受控激活平面\n工具调用 / 写回 / 回滚 / 证据账本]
    end

    subgraph Systems[企业系统]
        ERP[(ERP)]
        EDW[(EDW)]
        ITSM[(ITSM)]
        PM[(流程挖掘)]
        Docs[(知识库)]
        Sec[(安全系统)]
    end

    Systems --> DP
    DP --> MP
    MP --> CP
    CP --> SA
    SA --> Consumers
    Consumers --> AP
    AP --> Systems
    AP --> MP

7.1 数据与服务平面

这一层负责连接企业已有系统,包括:

  • ERP(Enterprise Resource Planning,企业资源计划);
  • EDW(Enterprise Data Warehouse,企业数据仓库);
  • ITSM(IT Service Management,IT 服务管理);
  • CRM(Customer Relationship Management,客户关系管理);
  • 流程挖掘平台;
  • 文档知识库;
  • 安全日志和监控系统;
  • 内部 API 和自动化工具。

关键不是把所有数据复制一遍,而是把数据源抽象成可治理的上下文源。每个源都需要带上血缘、更新时间、权限标签、可信等级和可调用能力。

7.2 元数据与语义平面

这一层负责定义企业世界里的“名词”和“关系”。

例如“供应商”这个实体,在采购系统、财务系统、合同系统里可能有不同 ID。UCL 需要通过实体解析把它们合并到统一语义对象上。

flowchart LR
    A[采购系统 Supplier ID] --> E[统一供应商实体]
    B[财务系统 Vendor ID] --> E
    C[合同系统 Counterparty ID] --> E
    D[风控系统 Risk Profile] --> E

    E --> F[合同]
    E --> G[采购订单]
    E --> H[发票]
    E --> I[交付记录]
    E --> J[风险事件]

这就是上下文图谱真正发挥作用的位置:它不只是保存知识,还负责把业务对象、事件、证据和历史决策连接起来。

7.3 控制平面

控制平面决定上下文能否被使用、如何被使用、能不能写回。常见能力包括:

  • 身份认证和权限控制;
  • 数据脱敏和最小化暴露;
  • 行级、字段级访问策略;
  • 上下文包评估;
  • 模型输出校验;
  • 审批规则;
  • 职责分离;
  • 数据血缘和审计。

上下文包进入模型前,可以设置质量门禁。例如:

指标含义示例阈值
answerable@k前 k 条证据是否足以回答问题≥ 90%
cite@k输出是否能引用前 k 条证据≥ 95%
faithfulness回答是否被证据支持≥ 95%
policy_pass是否通过权限和策略检查必须通过
schema_valid输出是否符合结构化 schema必须通过

这些指标让上下文从“拼出来的一段提示词”变成“经过测试的输入产品”。

7.4 情境分析平面

情境分析是 UCL 区别于普通数据层的关键。它负责判断当前状态属于哪种业务情境,并决定下一步应该推荐、执行、升级还是拒绝。

例如发票异常场景中,情境分析器要同时考虑:

  • 差异金额;
  • 合同条款;
  • 供应商历史表现;
  • 是否接近关账日期;
  • 是否影响现金流;
  • 是否存在欺诈风险;
  • 当前用户权限;
  • 自动处理策略。

情境分析器输出的不是一段自然语言,而是可执行决策结构:

{
  "situation": "invoice_three_way_match_exception",
  "risk_score": 0.31,
  "root_cause": "purchase_order_quantity_mismatch",
  "recommended_action": "adjust_po_quantity_within_tolerance",
  "requires_human_approval": false,
  "allowed_tools": [
    "get_contract_terms",
    "update_purchase_order",
    "release_invoice_hold"
  ],
  "evidence_required": true,
  "rollback_plan": "restore_previous_po_quantity_and_reapply_invoice_hold"
}

智能体拿到这样的结构,才能从“会聊天”进入“会处理”。

7.5 受控激活平面

受控激活负责把智能体决策变成真实业务动作,同时保证安全。

一个动作执行前至少要经过几类校验:

flowchart LR
    A[智能体提出动作] --> B{权限检查}
    B -- 不通过 --> X[拒绝并记录]
    B -- 通过 --> C{策略检查}
    C -- 不通过 --> Y[升级人工审批]
    C -- 通过 --> D{预写入验证}
    D -- 不通过 --> Z[返回修正建议]
    D -- 通过 --> E[执行业务 API]
    E --> F[写入证据账本]
    F --> G[更新上下文图谱]

这层的目标不是让智能体随意操作系统,而是让它在可证明、可撤销、可审计的边界内行动。

UCL 基座架构

架构图把 UCL 分成数据/服务、元数据、控制和情境分析等层次。最上层的情境分析像一个智能体网关:所有 Copilot 和自动化流程都通过它获取上下文、选择动作,并把结果写回证据账本与语义图谱。


8. UCL 带来的六个范式变化

8.1 上下文从临时输入变成受管控产品

传统做法里,上下文往往是运行时临时拼接出来的字符串。UCL 中的上下文包需要版本、schema、质量指标和发布流程。

一个上下文包可以长这样:

{
  "context_id": "ctx-invoice-2026-000381",
  "version": "1.4.2",
  "task": "invoice_exception_resolution",
  "subject": {
    "invoice_id": "INV-88421",
    "purchase_order_id": "PO-77290",
    "supplier_id": "SUP-1024"
  },
  "evidence": [
    {
      "type": "contract_clause",
      "source": "contract_repo",
      "id": "CLAUSE-12.3",
      "confidence": 0.98
    },
    {
      "type": "goods_receipt",
      "source": "erp",
      "id": "GR-66102",
      "confidence": 0.99
    }
  ],
  "policies": [
    "auto_release_allowed_if_difference_below_5000",
    "human_approval_required_for_new_supplier"
  ],
  "allowed_actions": [
    "request_supplier_credit_note",
    "adjust_po_within_tolerance",
    "release_invoice_hold"
  ],
  "eval": {
    "answerable_at_5": 0.94,
    "cite_at_5": 0.97,
    "faithfulness": 0.96
  }
}

这种结构能被测试、复用和审计,而不是每次靠工程师临时写 prompt。

8.2 异构数据源被统一到同一语义层

UCL 不要求企业推倒重来。ERP、EDW、ITSM、流程挖掘和文档库仍然保留原有职责,但它们暴露给智能体的上下文要经过统一语义映射。

这样做的好处是:财务 Copilot、供应链 Copilot、IT 运维 Copilot 不再各自维护一套“客户”“订单”“资产”“供应商”的定义。

8.3 元数据成为推理基座

元数据不再只是数据目录里的说明文字,而是智能体推理时可遍历的结构。字段含义、实体关系、血缘、权限、历史决策,都能进入上下文图谱。

8.4 一个基座服务多种消费模型

同一个 UCL 可以服务不同消费方式:

消费模式说明
S1:BI面向报表和分析
S2:ML面向机器学习特征和预测
S3:RAG面向问答和文档生成
S4:智能体面向推理、规划和工具调用
激活面向业务系统写回和自动化执行

没有统一基座时,每种模式都要重复做数据接入、权限控制和语义定义,成本高且容易不一致。

8.5 激活闭环必须受控

企业智能体最危险的部分不是回答错,而是“带着错误去执行”。UCL 要求所有写动作都经过预验证、策略判断、职责分离、回滚计划和证据记录。

8.6 情境分析让智能体从脚本走向自主

脚本化 Copilot 只能按预设路径处理问题。真正有价值的企业智能体需要根据上下文判断当前情况,识别根因,选择动作,并在不确定性过高时升级给人。

自主不是不受限制,而是在明确边界内做动态决策。


9. UCL 的八种工程模式

UCL 可以按八种模式逐步建设,不需要一次性完成所有能力。

模式目标关键产物
1. 源系统适配接入 ERP、ITSM、EDW、文档库、API连接器、事件流、数据血缘
2. 实体解析统一客户、供应商、订单、资产等对象主实体、ID 映射、置信度
3. 语义建模定义业务实体、关系、事件、状态本体、元图、关系 schema
4. 上下文编译为不同任务生成上下文包上下文模板、排序策略、裁剪规则
5. 质量评估判断上下文是否足以支持回答和行动answerable@k、cite@k、faithfulness
6. 权限治理控制谁能看、谁能问、谁能调用工具策略引擎、脱敏规则、审批矩阵
7. 受控激活安全执行写回动作预写入校验、回滚、证据账本
8. 情境分析根据上下文做风险评分和动作选择决策网关、路由器、升级规则

第 8 种模式相当于智能体网关。它不是简单转发请求,而是决定“这个任务该由哪个智能体处理、能否自动执行、需要哪些证据、失败后怎么恢复”。


10. 一个供应商延迟交货场景

假设供应商延迟交货,风险评分突然升高,客户交付截止日期临近。没有 UCL 时,流程通常是这样:

sequenceDiagram
    participant Ops as 运营人员
    participant ERP as ERP
    participant Portal as 供应商门户
    participant Risk as 风险系统
    participant Mail as 邮件/会议
    participant Finance as 财务系统

    Ops->>ERP: 查询采购订单和库存
    Ops->>Portal: 查询供应商承诺日期
    Ops->>Risk: 查看风险评分
    Ops->>Mail: 找历史沟通和例外审批
    Ops->>Finance: 确认付款和发票状态
    Ops->>Ops: 人工拼接判断

问题不在于数据不存在,而是数据分散在多个系统,且缺少统一证据链。争议处理可能需要 2 到 3 天,期间没有完整审计轨迹,也很难让智能体自主处理。

有 UCL 后,同一任务会变成受控闭环:

sequenceDiagram
    participant Event as 风险信号
    participant UCL as UCL 情境分析
    participant Graph as 上下文图谱
    participant Agent as 供应链智能体
    participant ERP as ERP / 业务系统
    participant Ledger as 证据账本

    Event->>UCL: 供应商延期 + 风险评分升高
    UCL->>Graph: 拉取订单、合同、库存、历史决策
    Graph-->>UCL: 返回结构化上下文包
    UCL->>UCL: 评分风险、识别根因、选择动作
    UCL->>Agent: 下发受控上下文与允许动作
    Agent->>ERP: 调整补货计划或触发替代供应
    ERP-->>Agent: 返回执行结果
    Agent->>Ledger: 写入证据、动作、理由、回滚信息
    Ledger->>Graph: 更新决策痕迹

几个变化很关键:

  • 智能体拿到的是结构化上下文包,不是散乱文档片段;
  • 动作范围由策略控制,不允许越权调用;
  • 每一步都有证据和来源;
  • 执行结果会回写图谱,成为下一次决策的上下文;
  • 只有超出策略边界的异常才升级给人工。

这就是从“辅助人查资料”到“在治理内自动处理”的区别。


11. 三个典型落地场景

11.1 发票例外处理

场景:发票被冻结,三方匹配失败。智能体需要拉取合同条款、采购订单、收货记录、发票信息和历史处理案例,判断根因并选择动作。

能力没有 UCL有 UCL
根因分析财务、采购人工查多个系统情境分析器聚合合同、订单、收货和发票
动作选择人工判断是改订单、重开发票还是争议处理根据政策和阈值选择允许动作
执行人工在 ERP 中操作通过受控激活调用 API
审计分散在邮件和系统评论中证据账本记录输入、理由、动作和结果

适合自动处理的是低风险、规则明确、证据充分的异常。高金额、新供应商、合同争议类问题仍然应该升级人工。

11.2 OTIF 恢复

OTIF(On-Time In-Full,按时足量交付)下降时,供应链团队需要判断问题来自供应商、库存、运输、产能还是需求预测。UCL 可以融合 ERP、物流、流程挖掘和历史履约数据,找到根因并触发补救动作。

步骤UCL 的作用
信号捕获发现 OTIF 指标异常
根因定位关联订单、库存、运输节点、供应商承诺
风险评分判断是否影响关键客户或高价值订单
动作执行触发替代供应、加急运输、库存重分配
结果验证跟踪 OTIF 是否恢复,并记录决策效果

11.3 重大事件拦截

IT 运维场景中,凌晨 2 点服务器延迟飙升。普通告警系统会通知值班人员,人工排查变更、日志、依赖服务和历史故障。

UCL 可以把监控告警、变更记录、服务拓扑、历史事故和回滚策略接在一起:

flowchart LR
    A[延迟告警] --> B[关联服务拓扑]
    B --> C[查找近期变更]
    C --> D[评估爆炸半径]
    D --> E{是否允许自动补救}
    E -- 是 --> F[执行回滚或扩容]
    E -- 否 --> G[升级值班工程师]
    F --> H[记录证据与结果]
    G --> H

MTTR(Mean Time To Recovery,平均恢复时间)能否从小时降到分钟,取决于系统是否提前准备好了上下文、权限和回滚路径。只有告警,没有受控行动,智能体仍然只能建议别人去处理。


12. 常见失败模式与 UCL 的防护方式

企业 GenAI(生成式人工智能)试点常见失败,往往可以归结为上下文层的问题。

失败模式机制UCL 防护方式
数据孤岛智能体只能看到局部系统多源接入和统一语义层
检索幻觉相似片段被误当成证据上下文图谱、引用校验、faithfulness 评估
权限越界模型拿到不该看的数据或工具控制平面、最小权限、脱敏
无法行动只能生成建议,不能安全写回受控激活、预写入验证、回滚
无法学习每次处理都从零开始决策痕迹回写上下文图谱
无法审计不知道模型为什么这么做证据账本记录上下文、理由和动作

这些问题靠“换更强模型”不能根治。模型能力决定上限,上下文工程决定生产可用性。


13. 建设 UCL 的落地路径

UCL 不适合从“大一统平台”开始。更可行的方式是围绕高价值流程逐步建设。

13.1 选一个闭环场景

优先选择同时具备以下特征的场景:

  • 业务价值明确;
  • 数据源有限但分散;
  • 有规则和历史案例可参考;
  • 存在重复人工判断;
  • 自动化动作可以被权限和阈值约束;
  • 执行结果容易验证。

发票异常、IT 事件处理、访问权限履行、供应链异常恢复,通常比开放式战略分析更适合作为起点。

13.2 定义核心实体和关系

不要一开始建全企业知识图谱。先围绕场景定义最小上下文图谱。

以发票异常为例,最小实体包括:

entities:
  - Supplier
  - PurchaseOrder
  - Invoice
  - Contract
  - GoodsReceipt
  - Policy
  - ExceptionCase
  - Decision

relationships:
  - Supplier issues Invoice
  - Invoice matches PurchaseOrder
  - PurchaseOrder governed_by Contract
  - GoodsReceipt confirms PurchaseOrder
  - ExceptionCase similar_to ExceptionCase
  - Decision based_on Evidence

有了最小图谱,才谈得上上下文编译和情境分析。

13.3 设计上下文包 schema

上下文包应该稳定、可测试,不能每次临时拼接。

context_package:
  task: string
  subject:
    entity_type: string
    entity_id: string
  facts:
    - name: string
      value: any
      source: string
      timestamp: datetime
      confidence: number
  evidence:
    - id: string
      type: string
      citation: string
      access_policy: string
  policies:
    - policy_id: string
      decision: allow | deny | require_approval
  allowed_actions:
    - tool_name: string
      constraints: object
  output_schema: object
  rollback_required: boolean

schema 的价值在于让上下文工程可自动化测试,也方便模型输出进入后续系统。

13.4 建立质量门禁

每次发布新的上下文模板或检索策略,都应该跑评估集。评估集可以来自历史工单、历史发票异常、历史事故等。

测试项检查内容
可回答性给定上下文是否包含解决任务所需证据
引用完整性输出中的关键结论是否能引用证据
权限正确性不同角色是否只能看到允许内容
动作合法性模型是否只选择允许工具
回滚完整性写动作是否有对应撤销方案
稳定性同类输入是否得到一致决策

13.5 先半自动,再自动

企业级智能体不应该一上线就全自动。更稳妥的路径是:

flowchart LR
    A[人工处理] --> B[AI 推荐 + 人工确认]
    B --> C[低风险动作自动执行]
    C --> D[中风险动作审批后执行]
    D --> E[策略内闭环自治]

每提高一级自动化,都要增加对应的评估、权限、回滚和审计能力。


14. 容易踩的坑

14.1 把 UCL 做成另一个数据湖

UCL 不是把所有数据复制到一个地方。它的重点是语义、证据、权限和行动闭环。盲目集中数据会带来成本、同步和合规问题。

14.2 把向量库当成上下文工程

向量检索只是上下文获取方式之一。企业智能体还需要结构化实体、关系、策略、证据、工具约束和写回机制。

14.3 只做读,不做写回

如果系统不能把新决策、新案例、新关系沉淀回上下文图谱,智能体就不会真正变聪明。运行时学习不是保存聊天记录,而是把有价值的决策痕迹结构化。

14.4 工具调用缺少预验证

让模型直接调用业务 API 风险很高。每个写动作都应该有参数校验、权限校验、策略校验、幂等控制和回滚计划。

14.5 忽略职责分离

某些动作不能由同一个角色完成所有步骤。例如创建供应商、修改付款信息、释放付款,往往需要不同权限或审批链。智能体也必须遵守这些规则。

14.6 上下文越塞越多

上下文工程不是把所有相关内容都塞进模型窗口。更好的做法是基于任务、角色、风险和证据质量编译上下文。少而准的上下文通常比多而乱的上下文更可靠。


15. 判断一个智能体是否真的企业级

可以用一组问题快速判断系统成熟度:

问题如果答案是否定的,说明什么
能否解释每个关键结论来自哪条证据?缺少证据链
不同角色看到的上下文是否不同?缺少权限治理
模型调用工具前是否经过策略检查?缺少受控激活
写回失败后能否回滚?不适合关键业务
新处理案例是否进入知识结构?缺少运行时学习
能否跨系统识别同一业务实体?语义层不足
能否区分推荐、审批、执行、升级?情境分析不足

只有这些问题都能回答清楚,AI 智能体才有资格进入企业核心流程。


16. UCL 的核心价值

UCL 的价值不是“再建一个中台”,而是把企业 AI 从松散应用推进到可治理的运行系统。

它把已有企业投资连接起来:ERP、EDW、ITSM、流程挖掘、文档库和业务 API 不需要被替换,而是通过统一语义和控制平面变成智能体可消费的上下文源。

它让上下文图谱从静态数据结构变成运行时系统:智能体读取图谱进行推理,执行动作后把证据和决策写回图谱,下一次任务再从更新后的图谱中获取更好的上下文。

它让自主变得可控:智能体可以在政策边界内自动处理低风险任务,在不确定性升高时升级人工,并且所有动作都能被审计和回滚。

企业级上下文工程的关键不是让模型知道更多,而是让模型在正确的时间拿到正确的证据,遵守正确的规则,调用正确的工具,并把正确的经验沉淀回来。UCL 正是围绕这个闭环建立的架构。


评论