CyberGym：AI网络安全能力的真实考验场

在人工智能快速发展的今天，AI代理能否胜任复杂的网络安全任务？来自加州大学伯克利分校的研究团队给出了答案——他们构建了包含1507个真实漏洞的CyberGym基准测试系统，用最严苛的方式检验AI代理的网络安全实战能力。

一、什么是CyberGym？

CyberGym是一个大规模、高质量的AI网络安全评估框架，核心特点：

真实漏洞库：基于188个开源软件项目中的1507个已修复漏洞构建
实战场景模拟：要求AI代理从代码库出发，生成可触发漏洞的概念验证（PoC）测试
多难度分级：从仅提供代码库到包含漏洞描述/补丁信息，设置不同挑战等级

“

就像给AI设置了一个”网络安全 CTF 赛场”，但题目全部来自真实世界的软件漏洞。

二、为什么需要CyberGym？

现有AI安全基准测试存在明显不足：

传统基准问题	CyberGym改进方案
代码库规模小	采用真实项目代码（平均1千+文件）
场景脱离实际	基于OSS-Fuzz发现的真实漏洞
任务复杂度低	要求跨文件分析，构造完整攻击链

三、实验结果：AI表现如何？

研究团队用4种AI框架（OpenHands、Codex等）和9种大模型进行测试，结果令人意外：

3.1 漏洞复现成功率

AI代理组合	成功率
OpenHands + Claude-3.7-Sonnet	11.9%
全部组合平均	<10%

“

即使表现最好的组合，成功率也仅约12%，且集中在简单案例。

3.2 零日漏洞发现

在后续测试中，AI生成的PoC意外触发最新软件版本崩溃：

发现32个潜在漏洞
确认15个全新零日漏洞
涉及6个开源项目

四、关键发现

4.1 AI行为模式

常用命令：频繁使用ls、grep等基础命令进行代码探索
脚本能力：能编写Python/Bash脚本构造复杂PoC
失败模式：常陷入无限试错循环，或过早放弃请求用户帮助

4.2 挑战因素

挑战类型	影响程度
PoC长度>100字节	成功率<8%
需要多步骤推理	集中在20-40步
复杂输入解析逻辑	显著降低成功率

五、常见问题解答

Q1: CyberGym的数据来源是什么？

基于Google的OSS-Fuzz持续模糊测试项目，涵盖从2002-2025年间的真实漏洞。所有数据均来自已修复的公开代码库。

Q2: AI代理具体如何操作？

在Docker容器化环境中，AI可以：

浏览代码文件
执行编译命令
编写测试脚本
提交PoC进行验证

Q3: 零日漏洞发现意味着什么？

虽然AI在已知漏洞复现上表现不佳，但其生成的测试用例意外发现了15个未公开漏洞，说明AI在模糊测试领域具有潜力。

Q4: 实验对开发者有何启示？

当前AI工具尚无法替代专业安全审计，但可作为：

辅助代码审查工具
模糊测试补充方案
安全培训测试平台

六、深度解读：AI安全能力的未来

6.1 技术瓶颈

上下文理解：难以处理跨文件依赖关系
长文本处理：PoC构造需要精确控制输入格式
安全知识图谱：缺乏漏洞利用模式的结构化理解

6.2 发展方向

改进方向	潜在方案
工具增强	提供代码结构可视化
训练优化	加入安全领域微调数据
混合系统	AI+传统模糊测试结合

七、总结

CyberGym揭示了当前AI在网络安全领域的真实能力：
能发现新问题，但解决已知问题尚需努力。随着模型持续进化，这类基准测试将成为推动AI安全能力发展的关键基础设施。

相关链接

“

思考：如果AI能持续发现人类未注意到的漏洞，是否意味着我们需要重新审视软件安全开发范式？

CyberGym揭示AI网络安全真实水平：1507个漏洞挑战下仅12%复现成功率