上下文图：理解企业真实流程，开启智能体自动化的下一代数据平台

如果我问你：“你们公司签一份新合同的流程到底是什么样的？”你可能会回答：“哦，就是销售提申请，法务审核，然后领导审批。”但这只是写在规章制度里的“应该”。现实往往是：销售小张在 Salesforce 里改了交易阶段，然后去 Slack 找法务小李，附上了最新版的谷歌文档链接；小李看完后评论了几处，又在日历上约了个会拉上产品和财务；会议记录被更新到 Notion，最终审批触发了一个自动化邮件。这个过程中，“如何”工作比“应该”如何工作复杂得多，且从未被完整记录。

这正是当前企业自动化面临的核心瓶颈。RPA和工作流工具能自动化的，只是那些被明确定义、结构清晰的流程。而企业中大部分工作，是由个人和小团队分布式完成的，其“流程”仅存在于员工的脑海和零散的沟通工具中，即所谓的“部落知识”。

一个根本性的问题摆在面前：如果我们想让AI智能体（Agents）学习并自动化这部分真正的主流工作，我们需要为它们提供一个怎样的“认知基础”？

答案是：一个能理解企业真实运作方式的数据平台。而这个平台的核心，正被越来越多的人称为 “上下文图”。

为什么说“上下文”是下一代数据平台？

过去几十年，企业信息化完成了数据的数字化。决策和结构化数据被记录在各类系统（如ERP、CRM）中，我们称之为“记录系统”。日常的协同工作则在通信工具（如Slack）、项目管理软件（如Jira）、代码仓库等“协作系统”中展开。

我们有了海量数据，但数据不等于理解。一个AI智能体即使能访问公司所有的数据库和文档，它仍然可能不知道：

当客户A的服务器发生严重故障时，应该联系谁？实际上又是哪些团队协作处理的？
批准一份跨部门的采购合同，理论上需要经过几道审批？现实中卡壳通常是因为哪个环节的何种沟通问题？

传统的企业数据平台，是为报告和分析而设计的。而下一代数据平台，则是为观察、学习和自动化而设计的。它的使命不是呈现“发生了什么”，而是理解“事情是如何发生的”，并以此为基础，让智能体能够可靠地推进工作。

这个平台需要的不再是孤立的数据库，而是一个统一的上下文层。它横跨你的所有应用、数据仓库和记录系统，将对企业数据（结构化和非结构化）、人际关系以及最关键的工作流程的共享理解整合在一起。

上下文必须随AI发展而进化

起初，我们认为卓越的搜索是上下文的基础。这意味着理解内容：索引非结构化数据，让员工可以搜索整个企业，快速找到最新的设计文档、政策更新或客户记录。这解决了“信息在哪里”的问题。

但随着AI开始承担更复杂的工作，我们发现这个基础需要扩展。仅仅理解企业数据是不够的；系统还需要关系知识。

企业工作的完成本质上是关系驱动的。你需要知道谁负责某个客户、谁审批某类合同、哪个工程师在值班、或者当事故升级时哪些团队会协作。没有这些关系脉络，AI就如同一个拥有图书馆通行证却不懂社会规则的外星人，无法有效行动。

上下文图，正是为了捕捉这种数据与关系交织的动态现实而生的。

上下文图到底是什么？它捕捉“如何”，而非“为什么”

关于上下文图，一个至关重要的精炼观点是：“你无法可靠地捕捉‘为什么’；但你可以捕捉‘如何’。”

“为什么”通常是一个思考步骤，存在于某人的脑海中——你实际上无法为其建模。它可能偶尔出现在会议记录或 Slack 对话的线索里，但大部分从未以清晰或持久的方式被记录下来。

而“如何”，则留下了丰富的数字痕迹：重复的步骤、数据更新、审批节点、协作模式、字段的变更以及跨系统的行为。经过多个工作周期，这些流程痕迹可以近似推导出“为什么”：你可以从工作反复完成的模式中推断出缘由，而不是试图一字不差地存储每个人的想法。

因此，上下文图的目标就是：现在捕捉“如何”（流程），并随着时间的推移学习“为什么”（意图）。如果智能体旨在自动化企业的实际工作，那么路径就是深度建模流程，以理解工作在何种条件下进行、暂停或升级。这样，当下次出现类似情况时，智能体就能推断出应采取的正确行动。

构建上下文图：一项不简单的技术投资

创建这种级别的知识和理解并非易事。构建企业级的上下文图是困难的，它需要一套技术栈的协同工作。

1. 可观察性：连接器与应用的广度与深度

要全面了解企业中发生的事，仅靠记录系统中干净、结构化的决策数据是远远不够的。它需要在工作真正发生的连接器和应用上具备可观察性——既要有广度以捕获员工使用的众多工具中的活动，也要有深度以从每个连接器中提取有意义的信号。

例如，一个 Salesforce 连接器可以暴露一笔交易的阶段变化。但真正的可观察性来自于同时看到关联应用中的活动：在谷歌文档中编辑的文档、在 Slack 中发送的消息、在日历中创建的会议、或在 Salesforce 中更新的记录。这些都需要通过各自的连接器直接从底层系统捕获。

2. 理解活动数据：从原子事件开始

除了索引内容，系统还必须捕获低级别的活动信号：在工具内发生的离散的、有时间戳的操作。这些事件包括文档编辑、字段更新、添加评论、发送 Slack 消息或上传文件。按时间顺序捕获这些动作，并跟踪它们之间的状态变化，就提供了原始的活动数据。

3. 推导高级理解：聚合出任务、项目与计划

只有在收集了这些原子活动数据之后，系统才能开始推断更高级别的概念。结合语义理解，多个低级别行为中的模式——重复的文档编辑、协同的 Slack 消息、对相同记录的高频更新——可以被聚合起来，以指示一项任务、一个项目或更广泛的计划。

例如，连续几天发生的文档创建、编辑、Slack 消息和跨系统记录更新，可能共同代表了一次客户 onboarding 或产品发布，即使这项工作从未在任何单个系统中被明确标记为如此。

将信号与噪音分离是困难的，尤其是在企业中。 以 Glean 为例，其任务理解的准确率达到了约 80% —— 这个指标表明了所有上游技术需要多么强大才能实现这一目标。更令人印象深刻的是，由于面向企业，上下文图并非在互联网规模上构建。数据无法跨客户聚合，并且由于隐私限制，生成的数据集规模更小且人类无法直接访问——这要求图表必须通过算法推断得出。

上下文图：下一代数据平台的核心组件

虽然上下文图目前备受关注，但要解决上下文问题不能依赖单一技术。实现真正的流程理解需要一个协同工作的技术栈：

连接器：用于观察跨工具的活动。
索引：实现快速检索。
图：建模企业结构和关系。
记忆：捕获智能体实际执行工作时发生的情况。

正是这个技术栈，使得系统能够从原始的企业数据演进到能够行动的智能体。

当智能体开始在企业中运作时，学习变得至关重要。对人类有效的方法并不总是能直接转化为智能体的行动。通过捕获执行痕迹——智能体如何使用工具、以何种顺序、产生什么结果——系统可以从实践中学习智能体的工作模式。这些痕迹构成了企业记忆，随时间推移捕获了对智能体真正有效的方法。

流程理解并非仅来自上下文图；它源于结构理解与习得行为的结合。

当你退一步，纵观所有这些层次——连接器、索引、图、个人与企业记忆——你会意识到，你实际上构建了一个全新的数据平台。这个平台的设计目的不是用于报告或分析，而是作为智能体自动化的支柱：一个观察工作如何发生、从实践执行中学习、并使智能体能够可靠地在整个企业内推进工作的系统。

FAQ：关于上下文图的常见疑问

Q：上下文图和知识图谱有什么区别？
A：知识图谱主要专注于实体（如人、产品、地点）及其之间的静态关系（如“谁是谁的经理”、“哪个产品属于哪个部门”）。上下文图则更侧重于动态的活动和流程。它不仅包含“谁”和“什么”，更重要的是捕捉“如何”——工作是如何通过一系列跨越不同工具和人员的活动完成的。它本质上是流程在数字世界中的映射。

Q：上下文层会取代现有的数据仓库或数据湖吗？
A：不会取代，而是互补和协同。数据仓库和数据湖擅长存储和批量分析历史数据。上下文层则是一个实时、动态的层，专注于理解当前的活动、关系和流程状态。它从这些现有数据源（以及协作工具）中获取信息，并为其添加“如何发生”的维度，共同构成支撑智能体自动化的下一代数据平台。

Q：智能体如何利用上下文图进行学习？
A：主要通过两个层面。首先，上下文图为智能体提供了行动的“地图”和“规则手册”，让它了解企业的人员、数据关系和既有流程模式（结构理解）。其次，当智能体开始行动后，其执行痕迹（成功或失败的操作序列）会被捕获并反馈到系统中，形成“企业记忆”。系统通过分析这些痕迹，可以优化流程模型，让智能体在未来遇到类似情境时做出更优决策（习得行为）。

Q：企业启动上下文图项目面临的最大挑战是什么？
A：根据文件内容，主要挑战有三点：1. 技术复杂性：需要建立覆盖广泛工具的可观察性，并能从低级别活动数据中准确推断高级别任务（文件提到达到80%准确率已属不易）。2. 数据隐私与隔离：企业数据不能跨客户聚合，且涉及敏感信息，必须在隐私约束下通过算法构建图谱。3. 文化转变：这不仅仅是IT项目，更是对工作方式的深刻理解与重塑，需要业务部门的深度参与。

Q：这是“智能体记忆”的另一种说法吗？
A：相关，但不完全等同。智能体记忆更侧重于存储智能体自身的交互历史和经验。上下文图的范围更广，它构成了智能体记忆所依赖的“世界模型”。它包含了企业的静态结构、动态流程以及与其他智能体或人类协作的共享环境。可以说，上下文图是公共的、共享的“企业记忆库”，而单个智能体的记忆是其私有的、基于此上下文的操作经验。

结论：上下文是智能体工作的基石

回到最初的问题：我们如何让智能体在企业中成功完成工作？它们如何能像你的企业一样学习、理解和运作？

答案越来越清晰：这个机会依赖于一个上下文基础。这个基础理解你的企业数据、你的人际关系，更重要的是，理解你的实际工作流程。

上下文图不仅仅是又一个热门技术概念。它代表了我们对企业信息化认知的一次关键演进：从记录“什么”，到理解“如何”。它正在塑造的，不是一个更好的报表系统，而是一个能够观察、学习并最终自主驱动业务发展的智能系统平台。这，就是正在我们眼前成形的、下一代的数据平台。

企业流程真相曝光：为什么80%的工作，你老板和你都说不清？