上下文图:理解企业真实流程,开启智能体自动化的下一代数据平台
如果我问你:“你们公司签一份新合同的流程到底是什么样的?”你可能会回答:“哦,就是销售提申请,法务审核,然后领导审批。”但这只是写在规章制度里的“应该”。现实往往是:销售小张在 Salesforce 里改了交易阶段,然后去 Slack 找法务小李,附上了最新版的谷歌文档链接;小李看完后评论了几处,又在日历上约了个会拉上产品和财务;会议记录被更新到 Notion,最终审批触发了一个自动化邮件。这个过程中,“如何”工作比“应该”如何工作复杂得多,且从未被完整记录。
这正是当前企业自动化面临的核心瓶颈。RPA和工作流工具能自动化的,只是那些被明确定义、结构清晰的流程。而企业中大部分工作,是由个人和小团队分布式完成的,其“流程”仅存在于员工的脑海和零散的沟通工具中,即所谓的“部落知识”。
一个根本性的问题摆在面前:如果我们想让AI智能体(Agents)学习并自动化这部分真正的主流工作,我们需要为它们提供一个怎样的“认知基础”?
答案是:一个能理解企业真实运作方式的数据平台。而这个平台的核心,正被越来越多的人称为 “上下文图”。
为什么说“上下文”是下一代数据平台?
过去几十年,企业信息化完成了数据的数字化。决策和结构化数据被记录在各类系统(如ERP、CRM)中,我们称之为“记录系统”。日常的协同工作则在通信工具(如Slack)、项目管理软件(如Jira)、代码仓库等“协作系统”中展开。
我们有了海量数据,但数据不等于理解。一个AI智能体即使能访问公司所有的数据库和文档,它仍然可能不知道:
-
当客户A的服务器发生严重故障时,应该联系谁?实际上又是哪些团队协作处理的? -
批准一份跨部门的采购合同,理论上需要经过几道审批?现实中卡壳通常是因为哪个环节的何种沟通问题?
传统的企业数据平台,是为报告和分析而设计的。而下一代数据平台,则是为观察、学习和自动化而设计的。它的使命不是呈现“发生了什么”,而是理解“事情是如何发生的”,并以此为基础,让智能体能够可靠地推进工作。
这个平台需要的不再是孤立的数据库,而是一个统一的上下文层。它横跨你的所有应用、数据仓库和记录系统,将对企业数据(结构化和非结构化)、人际关系以及最关键的工作流程的共享理解整合在一起。
上下文必须随AI发展而进化
起初,我们认为卓越的搜索是上下文的基础。这意味着理解内容:索引非结构化数据,让员工可以搜索整个企业,快速找到最新的设计文档、政策更新或客户记录。这解决了“信息在哪里”的问题。
但随着AI开始承担更复杂的工作,我们发现这个基础需要扩展。仅仅理解企业数据是不够的;系统还需要关系知识。
企业工作的完成本质上是关系驱动的。你需要知道谁负责某个客户、谁审批某类合同、哪个工程师在值班、或者当事故升级时哪些团队会协作。没有这些关系脉络,AI就如同一个拥有图书馆通行证却不懂社会规则的外星人,无法有效行动。
上下文图,正是为了捕捉这种数据与关系交织的动态现实而生的。
上下文图到底是什么?它捕捉“如何”,而非“为什么”
关于上下文图,一个至关重要的精炼观点是:“你无法可靠地捕捉‘为什么’;但你可以捕捉‘如何’。”
“为什么”通常是一个思考步骤,存在于某人的脑海中——你实际上无法为其建模。它可能偶尔出现在会议记录或 Slack 对话的线索里,但大部分从未以清晰或持久的方式被记录下来。
而“如何”,则留下了丰富的数字痕迹:重复的步骤、数据更新、审批节点、协作模式、字段的变更以及跨系统的行为。经过多个工作周期,这些流程痕迹可以近似推导出“为什么”:你可以从工作反复完成的模式中推断出缘由,而不是试图一字不差地存储每个人的想法。
因此,上下文图的目标就是:现在捕捉“如何”(流程),并随着时间的推移学习“为什么”(意图)。如果智能体旨在自动化企业的实际工作,那么路径就是深度建模流程,以理解工作在何种条件下进行、暂停或升级。这样,当下次出现类似情况时,智能体就能推断出应采取的正确行动。
构建上下文图:一项不简单的技术投资
创建这种级别的知识和理解并非易事。构建企业级的上下文图是困难的,它需要一套技术栈的协同工作。
1. 可观察性:连接器与应用的广度与深度
要全面了解企业中发生的事,仅靠记录系统中干净、结构化的决策数据是远远不够的。它需要在工作真正发生的连接器和应用上具备可观察性——既要有广度以捕获员工使用的众多工具中的活动,也要有深度以从每个连接器中提取有意义的信号。
例如,一个 Salesforce 连接器可以暴露一笔交易的阶段变化。但真正的可观察性来自于同时看到关联应用中的活动:在谷歌文档中编辑的文档、在 Slack 中发送的消息、在日历中创建的会议、或在 Salesforce 中更新的记录。这些都需要通过各自的连接器直接从底层系统捕获。
2. 理解活动数据:从原子事件开始
除了索引内容,系统还必须捕获低级别的活动信号:在工具内发生的离散的、有时间戳的操作。这些事件包括文档编辑、字段更新、添加评论、发送 Slack 消息或上传文件。按时间顺序捕获这些动作,并跟踪它们之间的状态变化,就提供了原始的活动数据。
3. 推导高级理解:聚合出任务、项目与计划
只有在收集了这些原子活动数据之后,系统才能开始推断更高级别的概念。结合语义理解,多个低级别行为中的模式——重复的文档编辑、协同的 Slack 消息、对相同记录的高频更新——可以被聚合起来,以指示一项任务、一个项目或更广泛的计划。
例如,连续几天发生的文档创建、编辑、Slack 消息和跨系统记录更新,可能共同代表了一次客户 onboarding 或产品发布,即使这项工作从未在任何单个系统中被明确标记为如此。
将信号与噪音分离是困难的,尤其是在企业中。 以 Glean 为例,其任务理解的准确率达到了约 80% —— 这个指标表明了所有上游技术需要多么强大才能实现这一目标。更令人印象深刻的是,由于面向企业,上下文图并非在互联网规模上构建。数据无法跨客户聚合,并且由于隐私限制,生成的数据集规模更小且人类无法直接访问——这要求图表必须通过算法推断得出。
上下文图:下一代数据平台的核心组件
虽然上下文图目前备受关注,但要解决上下文问题不能依赖单一技术。实现真正的流程理解需要一个协同工作的技术栈:
-
连接器:用于观察跨工具的活动。 -
索引:实现快速检索。 -
图:建模企业结构和关系。 -
记忆:捕获智能体实际执行工作时发生的情况。
正是这个技术栈,使得系统能够从原始的企业数据演进到能够行动的智能体。
当智能体开始在企业中运作时,学习变得至关重要。对人类有效的方法并不总是能直接转化为智能体的行动。通过捕获执行痕迹——智能体如何使用工具、以何种顺序、产生什么结果——系统可以从实践中学习智能体的工作模式。这些痕迹构成了企业记忆,随时间推移捕获了对智能体真正有效的方法。
流程理解并非仅来自上下文图;它源于结构理解与习得行为的结合。
当你退一步,纵观所有这些层次——连接器、索引、图、个人与企业记忆——你会意识到,你实际上构建了一个全新的数据平台。这个平台的设计目的不是用于报告或分析,而是作为智能体自动化的支柱:一个观察工作如何发生、从实践执行中学习、并使智能体能够可靠地在整个企业内推进工作的系统。
FAQ:关于上下文图的常见疑问
Q:上下文图和知识图谱有什么区别?
A:知识图谱主要专注于实体(如人、产品、地点)及其之间的静态关系(如“谁是谁的经理”、“哪个产品属于哪个部门”)。上下文图则更侧重于动态的活动和流程。它不仅包含“谁”和“什么”,更重要的是捕捉“如何”——工作是如何通过一系列跨越不同工具和人员的活动完成的。它本质上是流程在数字世界中的映射。
Q:上下文层会取代现有的数据仓库或数据湖吗?
A:不会取代,而是互补和协同。数据仓库和数据湖擅长存储和批量分析历史数据。上下文层则是一个实时、动态的层,专注于理解当前的活动、关系和流程状态。它从这些现有数据源(以及协作工具)中获取信息,并为其添加“如何发生”的维度,共同构成支撑智能体自动化的下一代数据平台。
Q:智能体如何利用上下文图进行学习?
A:主要通过两个层面。首先,上下文图为智能体提供了行动的“地图”和“规则手册”,让它了解企业的人员、数据关系和既有流程模式(结构理解)。其次,当智能体开始行动后,其执行痕迹(成功或失败的操作序列)会被捕获并反馈到系统中,形成“企业记忆”。系统通过分析这些痕迹,可以优化流程模型,让智能体在未来遇到类似情境时做出更优决策(习得行为)。
Q:企业启动上下文图项目面临的最大挑战是什么?
A:根据文件内容,主要挑战有三点:1. 技术复杂性:需要建立覆盖广泛工具的可观察性,并能从低级别活动数据中准确推断高级别任务(文件提到达到80%准确率已属不易)。2. 数据隐私与隔离:企业数据不能跨客户聚合,且涉及敏感信息,必须在隐私约束下通过算法构建图谱。3. 文化转变:这不仅仅是IT项目,更是对工作方式的深刻理解与重塑,需要业务部门的深度参与。
Q:这是“智能体记忆”的另一种说法吗?
A:相关,但不完全等同。智能体记忆更侧重于存储智能体自身的交互历史和经验。上下文图的范围更广,它构成了智能体记忆所依赖的“世界模型”。它包含了企业的静态结构、动态流程以及与其他智能体或人类协作的共享环境。可以说,上下文图是公共的、共享的“企业记忆库”,而单个智能体的记忆是其私有的、基于此上下文的操作经验。
结论:上下文是智能体工作的基石
回到最初的问题:我们如何让智能体在企业中成功完成工作?它们如何能像你的企业一样学习、理解和运作?
答案越来越清晰:这个机会依赖于一个上下文基础。这个基础理解你的企业数据、你的人际关系,更重要的是,理解你的实际工作流程。
上下文图不仅仅是又一个热门技术概念。它代表了我们对企业信息化认知的一次关键演进:从记录“什么”,到理解“如何”。它正在塑造的,不是一个更好的报表系统,而是一个能够观察、学习并最终自主驱动业务发展的智能系统平台。这,就是正在我们眼前成形的、下一代的数据平台。

