Odyssey:用开放世界技能赋能 Minecraft 智能体

Minecraft 智能体的革命性突破

想象一下:一个 AI 角色在 Minecraft 世界中自主探索、制造钻石剑、与怪物战斗、经营农场… 这不再是科幻场景!浙江大学 VIPA 实验室推出的 「Odyssey 框架」 让这一切成为现实。这个突破性技术为 Minecraft 智能体赋予了真正的开放世界生存能力,今天我将带您全面解析这一前沿成果。

📌 「核心价值」:Odyssey 解决了现有 Minecraft 智能体只能完成基础任务的局限(如收集材料),通过三大创新实现了真正的开放世界交互能力

技术架构全景图

三大核心技术支柱

  1. 「开放世界技能库」

    • 40 种基础技能(采矿/建造等)
    • 183 种组合技能(如“制造武器→战斗”)
    • 示例技能链:收集木材→制作工作台→制造木镐→采集石头→制作石剑
  2. 「专业 Minecraft 知识引擎」

    • 基于 LLaMA-3 微调的专业模型
    • 训练数据:390,000+ 条 Minecraft Wiki 问答
    • 可解答如“如何在下界找到堡垒遗迹?”等复杂问题
  3. 「三维能力评测体系」

    任务类型 测试重点 示例挑战
    长时规划 多阶段目标管理 从零开始挖到钻石
    动态规划 即时反应能力 同时应对多个怪物
    自主探索 环境认知能力 发现未知区域资源

实际效果演示

从零开始挖钻石

挖钻石演示

武器制作与战斗

战斗演示

农场经营

农场演示

快速上手指南

环境搭建四步法

# 1. 安装Python依赖
cd Odyssey
pip install -e .
pip install -r requirements.txt

# 2. 配置Node.js环境
npm install -g yarn
cd Odyssey/odyssey/env/mineflayer
yarn install

# 3. 部署Minecraft服务器(推荐Docker方案)
# 详见官方文档:/Odyssey/docs/run_using_docker.md

# 4. 下载嵌入模型
git lfs install
git clone https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2.git

配置文件模板

创建 config.json 包含以下关键参数:

{
  "server_host": "LLaMa服务IP",
  "server_port": "LLaMa服务端口",
  "NODE_SERVER_PORT": "Node服务端口",
  "SENTENT_EMBEDDING_DIR": "嵌入模型路径",
  "MC_SERVER_HOST": "Minecraft服务器IP",
  "MC_SERVER_PORT": "Minecraft服务器端口"
}

四大任务实战

1. 子目标串联任务

def test_subgoal():
    odyssey = Odyssey(environment='subgoal')
    test_sub_goals = ["制作工作台", "制作木镐", "制作石镐", "制作铁镐", "挖掘钻石"]
    odyssey.inference_sub_goal(sub_goals=test_sub_goals)

2. 长时规划(战斗)

def test_combat():
    odyssey = Odyssey(environment='combat')
    combat_tasks = ["1只末影人", "3只僵尸", "1僵尸+1骷髅"]
    for task in combat_tasks:
        odyssey.inference(task=task)

3. 动态规划(农业)

def test_farming():
    odyssey = Odyssey(environment='farming')
    farming_tasks = [
        "剪1只羊获取羊毛",
        "收集1桶牛奶",
        "烹饪1块肉",
        "收集并种植1颗种子"
    ]
    for task in farming_tasks:
        odyssey.learn(goals=task)

4. 自主探索

def explore():
    odyssey = Odyssey(environment='explore')
    odyssey.learn()  # 完全自主探索模式

技术演进图谱

里程碑 日期 突破性进展
项目开源 2024年6月13日 首次发布GitHub仓库
论文公开 2024年7月23日 发布技术原理文档
技能库开源 2024年8月14日 开放183种组合技能
爬虫工具开源 2024年9月1日 发布Wiki数据采集工具
多智能体框架 2025年2月23日 支持多AI协作
IJCAI 2025入选 2025年4月29日 获顶级会议认可

学术影响力

「25项相关研究」 推动领域发展:

  1. MineRL (IJCAI 2019) – 首个大规模数据集
  2. Voyager (arXiv 2023) – 开放探索先驱
  3. JARVIS-1 (arXiv 2023) – 多任务处理突破
  4. VillagerAgent (ACL 2024) – 多智能体协作
  5. GROOT-2 (arXiv 2024) – 弱监督学习方案

💡 提示:完整文献列表见项目GitHub的Related Works章节

资源获取方式

所有组件均开源:

常见问题解答

Q:需要什么硬件配置?

「A」:建议配置:

  • GPU:≥12GB显存(运行LLaMA-3 8B模型)
  • RAM:≥32GB
  • 存储:≥50GB(含Minecraft服务端)

Q:能自定义新技能吗?

「A」:支持!通过修改 skill_library 目录中的JSON文件:

{
  "技能名称": "驯服狼",
  "前置条件": ["生肉", "骨头"],
  "操作序列": ["找到狼群", "手持骨头", "右键点击狼"]
}

Q:与Voyager框架的主要区别?

「A」:核心差异在三点:

  1. Odyssey的技能库规模扩大3倍
  2. 专用Minecraft知识模型(非通用LLM)
  3. 动态环境应对能力(如突然出现的怪物)

结语与展望

Odyssey 代表了 Minecraft 智能体研究的重大突破:首次实现了在复杂开放世界中的长期生存能力。团队将持续优化:

  1. 技能库扩展至300+动作
  2. 多智能体协作生态
  3. 真实物理环境迁移

项目作者:刘顺宇、李耀如等(浙江大学VIPA实验室)
论文引用:

@inproceedings{liu2025odyssey,
  title={Odyssey: Empowering Minecraft Agents with Open-World Skills},
  author={Shunyu Liu et al.},
  booktitle={IJCAI},
  year={2025}
}