OpenClaw 2026.4.27 版本发布:更智能的桌面控制、新模型接入与全方位稳定性提升
如果你正在使用或关注 OpenClaw 这个开源项目,那么 2026 年 4 月 27 日发布的最新版本值得你花时间了解。这次更新带来了几个重量级的新功能,同时修复了大量影响日常使用体验的问题。无论你是刚接触 OpenClaw 的新用户,还是已经在生产环境中部署的老用户,这篇文章都会帮你快速掌握这次更新的核心变化。
让我先带你看看这次更新最引人注目的几个亮点,然后我们再深入细节。
本次更新的三大主线
这次发布围绕着三条清晰的主线展开:一是让 AI 助手能够直接操控桌面环境的 Codex Computer Use 功能正式落地;二是 DeepInfra 作为新的模型供应商加入,为图像、语音、视频等多媒体任务提供了更多选择;三是大量底层可靠性的修复,让 Telegram、Slack、Matrix 等消息渠道的稳定性显著提升。
另外,腾讯元宝和 QQ 机器人的支持也进一步扩展了 OpenClaw 在国内即时通讯生态中的覆盖面。插件系统也向着”清单优先”的元数据管理方式迈出了重要一步,这让插件的启动效率更高,管理也更透明。
下面我们按主题逐一展开说明。
Codex Computer Use:让 AI 真正”看见”并操作你的桌面
这次更新中最值得关注的功能,当属 Codex Computer Use。简单来说,这个功能让你的 AI 助手具备了查看屏幕、操控鼠标键盘的能力——当然,这一切都在严格的权限控制下运行。
它解决了什么问题?
以往,当我们让 AI 帮忙完成一些需要操作桌面软件的任务时,它只能通过文字描述来猜测界面状态。而现在,Codex Computer Use 模式下的 AI 可以直接”看到”屏幕内容,并做出相应的操作。这对于自动化测试、重复性办公任务、以及需要跨多个桌面应用协作的场景来说,是一个质的飞跃。
具体包含哪些能力?
新版本为 Codex 模式的智能体提供了完整的 Computer Use 设置流程,包括:
-
状态检查命令: /codex computer-use status可以查看当前 Computer Use 环境的准备情况 -
一键安装命令: /codex computer-use install完成环境的初始化部署 -
市场发现机制:可以从市场中查找和安装相关的扩展组件 -
可选自动安装:初次使用时可以选择让系统自动完成环境搭建 -
安全保护机制:在 Codex 模式启动前,系统会检查 MCP(Model Context Protocol)服务器的状态,如果服务器不可用则拒绝进入桌面操控模式
这套机制被称为”故障关闭”,意味着当安全前提不满足时,系统会主动阻断桌面控制能力,而不是带着隐患运行。
与技术栈的配合关系
如果你同时在用 OpenClaw.app 的 PeekabooBridge,官方的文档已经更新,详细说明了 Codex Computer Use、直接的 cua-driver mcp 以及 PeekabooBridge 三者之间如何协同工作。这让你在规划桌面控制的整体方案时,能更清楚地做出选择。
“
一个实用的提醒:如果你在设备上安装了 Codex 但尚未配置 OpenAI 的认证信息,系统不会自动暴露 Codex 的代理能力。你需要显式地在配置中启用
skills.entries.coding-agent.enabled,这样才能激活相关技能。这个设计避免了因为误配置而导致的功能异常。
DeepInfra:一个全能型的新供应商加入
对于需要处理图像、音频、视频等多模态任务的用户来说,供应商的选择越多越好。这次更新正式引入了 DeepInfra 作为内置支持的供应商。
DeepInfra 能做什么?
DeepInfra 的接入覆盖了非常完整的能力矩阵:
-
动态模型发现:可以自动获取 DeepInfra 上当前可用的 OpenAI 兼容模型列表 -
图像生成与编辑:支持文生图和图像编辑功能 -
图像与音频理解:可以对上传的图片和音频进行分析理解 -
文字转语音:提供 TTS(文本转语音)能力 -
文本转视频:支持从文本生成视频内容 -
文本嵌入:用于记忆搜索和语义检索的向量嵌入生成 -
静态目录元数据:提供稳定的模型目录信息供审计和查询
如何使用?
配置 DeepInfra 非常直接:设置环境变量 DEEPINFRA_API_KEY 即可完成认证。DeepInfra 采用供应商自有的基础 URL 策略,这意味着你不需要额外配置 API 端点地址,系统会使用 DeepInfra 官方的基础 URL。
腾讯元宝与 QQ 机器人:国内即时通讯支持升级
对于国内用户来说,腾讯元宝和 QQ 机器人的支持是一个务实的功能扩展。
腾讯元宝
新版本为腾讯元宝开放了外部渠道插件。文档中加入了专门的快速入门指南,覆盖了 WebSocket 机器人的私聊和群聊场景。这意味着你可以通过元宝的接口来对接 OpenClaw 的智能体能力。
QQ 机器人
QQ 机器人的支持在本次更新中得到了大幅度的功能增强:
-
完整群聊支持:包括群聊历史追踪、@提醒触发机制、多种激活模式、以及按群配置的灵活策略 -
消息队列管理:采用 FIFO(先进先出)队列配合发送去抖动机制 -
C2C 流式消息:支持一对一聊天场景下的流式消息推送 -
大文件分块上传:统一的媒体发送模块支持大文件的分块上传 -
引擎架构重构:底层引擎被重构为管道阶段模式,输出子模块更加聚焦,内置斜杠命令模块也做了优化
这些改进让 QQ 机器人在群聊场景中的表现更加稳定和可控。
插件清单优先:启动更快,管理更清晰
如果你安装了不少插件,可能会注意到启动时加载时间变长的问题。这次更新朝”清单优先”的元数据管理方式迈出了重要一步。
什么是清单优先?
简单理解,插件清单是一个描述插件基本信息的文件,其中包含插件的激活条件、提供的模型目录、别名和排除规则等。在这次更新之前,这些信息往往需要在运行时动态计算和查询。而现在,越来越多的元数据被前置到了清单文件中。
带来了什么好处?
-
启动速度提升:网关启动时只需要读取清单文件,不需要加载插件的完整代码就能判断哪些插件需要激活 -
模型目录更易审计:各个供应商的模型行、别名和排除规则都在清单中声明,方便查看和维护 -
显式的启动声明:插件需要明确声明 activation.onStartup,才会在网关启动时被导入。这避免了不必要的启动时加载
需要留意的地方
如果你是自己开发插件的作者,需要注意:旧的隐式启动加载方式虽然仍然保留,但已经被标记为弃用。建议迁移到显式的 activation.onStartup 元数据声明方式。系统会为还在使用旧方式的插件输出兼容性警告。
稳定性修复:覆盖多个渠道和核心组件
本次更新中,修复类的问题占据了相当大的篇幅。以下按影响范围分类整理。
Telegram 相关修复
Telegram 作为使用最广泛的渠道之一,这次修复涉及多个场景:
| 问题场景 | 修复内容 |
|---|---|
| 启动失败 | 当 Telegram 的 getMe 令牌探测返回 401 时,现在直接报告令牌认证失败,而不会误报为 deleteWebhook 清理失败 |
| 外发消息超时 | 对外发 Bot API 调用添加了超时限制,并缓存了插件别名查询结果,避免因慢速 Telegram 响应或 WSL2 文件系统扫描导致网关回复阻塞 |
| 多账户审批路由 | 修复了多机器人账户场景下审批目标的账户 ID 匹配问题 |
| WebSocket 模式 | 在网络故障恢复后可重试 setWebhook 注册,本地监听器保持运行不关闭 |
| 媒体发送 | 修复了流式发送文本后图像生成输出丢失的问题 |
| 轮询偏移追踪 | 重构了轮询更新的偏移追踪机制,确保偏移量在重启和异常恢复后不会丢失 |
Slack 相关修复
-
Socket Mode 超时:默认启用了 15 秒的 Slack SDK pong 超时,并新增了多个配置项让你可以灵活调整 -
媒体下载卡死:修复了私密文件和转发附件下载时可能无限等待的问题 -
自动回复清理:修复了配置的会话重置短语(如 new session)可能泄漏到模型新一轮对话中的问题
Matrix 相关改进
-
在实时预览编辑中添加了工具进度更新的流式推送 -
审批消息现在携带版本化的结构化元数据,兼容新版 Matrix 客户端渲染
会话与记忆系统
会话管理的稳定性得到了多方面的加固:
-
会话历史默认值: chat.history和sessions.list的默认参数现在与后端运行时状态一致 -
设备配对恢复:修复了设备配对状态文件因格式错误导致已配对条目丢失的问题 -
网关认证:修复了设备令牌过期后重连导致的限流循环问题 -
审批幂等性:重复的审批决议在宽限窗口期内被视为幂等操作 -
记忆压缩:压缩前的记忆刷新提示词不再暴露在会话记录中
智能体执行与模型故障转移
-
子智能体模型覆盖: sessions_spawn.model现在会作为子会话的初始模型 -
故障转移记录:新增了 model.fallback_step轨迹事件,记录了每次故障转移的源模型、目标模型和失败原因 -
空输出处理:静默的 exec 更新和节点返回结果现在会输出 (no output),避免 Anthropic 兼容供应商拒绝空的工具结果文本
Docker 与沙盒环境
Docker 沙盒环境获得了两个实用的能力:
-
GPU 透传:新增了可选的
sandbox.docker.gpus配置项。当 Docker 运行时支持--gpus参数时,你可以让沙盒内的智能体直接使用主机的 GPU 进行本地推理或训练。 -
默认镜像修复:修复了一个容易让人困惑的问题:当默认沙盒镜像缺失时,系统不会再错误地将纯 Debian 镜像标记为
openclaw-sandbox:bookworm-slim,而是正确地引导你去构建包含 Python 工具链的默认镜像。
控制 UI 与 WebChat 体验优化
面向终端用户的 Web 界面也得到了一些细致的改进:
-
大文件上传:修复了上传大尺寸 PDF 或图片时触发的 RangeError: Maximum call stack size exceeded错误 -
新建会话按钮:工具栏的新建会话按钮现在会先确认重置再执行 -
附件支持:非图片类型的文件附件现在也可以通过聊天上传来处理 -
流式渲染:修复了重复的聊天消息渲染和处理问题 -
TTS 音频:最终模式的 TTS 音频现在以补充音频更新的方式持久化,不会在文字消息外多出一条重复记录 -
工具输出安全:在将工具调用参数、执行结果和配置信息推送到控制 UI 前,会进行敏感信息脱敏处理
macOS、iOS 与 Windows 平台更新
各平台的应用和守护进程也获得了维护性的更新:
-
macOS:更新了 Peekaboo、ElevenLabsKit 等核心依赖,修复了更新前网关服务停止的问题,LaunchAgent 服务密钥不再存储在全局可读的 plist 文件中 -
iOS:工程文件经过了 SwiftFormat 和 SwiftLint 的检查,SIM 卡构建和逻辑测试均无警告 -
Windows:修复了重启令牌在无监听者时可能丢失的问题,改进了失败任务调度的重试机制
你可能想问的问题
这次更新需要我做什么吗?
如果你是通过 npm 安装的 OpenClaw,执行 openclaw update 即可完成更新。更新过程中系统会跳过你在配置中禁用的插件检查和同步,保留其安装记录。
如果你使用了 models.pricing.enabled 配置项,可以关注一下:新增的这个选项允许在离线或受限网络环境中跳过启动时的供应商定价目录获取,同时保持显式模型成本信息的可用。
DeepInfra 和已有的供应商有什么不同?
DeepInfra 的特点在于它的多模态能力覆盖非常完整。除了常规的文本对话,它还提供图像生成/编辑、图像/音频理解、文本转语音、文本转视频、嵌入向量等全套能力。如果你需要在一个供应商上完成多种多媒体任务,DeepInfra 提供了一个统一的选择。
Codex Computer Use 安全吗?
OpenClaw 团队为 Computer Use 设计了多重保护机制。最核心的一点是”故障关闭”:在进入 Codex 模式之前,系统会强制检查 MCP 服务器的可用性。如果检查不通过,桌面控制功能不会被激活。此外,桌面控制相关的危险指令(如媒体操作)默认是关闭的,需要手动开启。
QQ 机器人的群聊功能怎么用?
群聊支持完整的历史追踪和 @ 提醒触发。你可以在配置中为每个群设置独立的策略,包括激活模式(哪些情况下响应)和消息队列的行为。群聊中默认采取私密回复策略,除非智能体主动使用消息工具,否则不会自动在群里发布回复。
插件需要更新吗?
如果你使用的是内置插件,系统会自动处理。如果你是外部插件的开发者,建议关注弃用警告。旧的隐式启动加载方式在未来版本中可能会被移除。清单优先的元数据方式是目前推荐的实践。
总结
OpenClaw 2026.4.27 版本是一次兼顾功能扩展与稳定性加固的更新。Codex Computer Use 为桌面自动化开辟了新的可能性,DeepInfra 的加入丰富了多模态任务的供应商选择,腾讯元宝和 QQ 机器人的支持让国内即时通讯场景的对接更加顺畅。
与此同时,大量修复覆盖了从会话管理到渠道通信、从模型故障转移到沙盒环境的各个层面。如果你是正在使用 OpenClaw 的用户,升级到这个版本将带来更稳定的日常体验。
如果你想查看完整的变更清单,可以访问 OpenClaw 的发布页面,那里有每一项变更的详细技术描述和相关的 Issue 链接。
