技术前沿归档 | 第2页共2页

8个月前高效码农

InteractVLM：基于2D基础模型的3D交互推理技术一、引言在计算机视觉和人工智能领域，如何从二维图像中准确推理出三维交互信息一直是一个具有挑战性的问题。InteractVLM的出现为解决这 …

8个月前高效码农

DeSTA2.5-Audio：开启通用大型音频语言模型新时代你是否想过，机器如何像人类一样理解复杂多变的声音世界？从语音中的细微情感波动，到环境音里的丰富信息，再到音乐的美妙旋律，这些声音背后蕴含着 …

8个月前高效码农

奖励模型训练新突破：Skywork-Reward-V2 如何通过数据质量提升 AI 对齐能力 1. 从聊天机器人到智能助理：奖励模型为何重要？当我们在使用各种 AI 助手时，是否好奇它们如何判断哪种 …

8个月前高效码农

LLM Speedrunner：自动化评估AI代理科学创新能力的基准测试系统 Unsplash图片引言：当AI开始复现人类科学突破在生成式AI技术飞速发展的今天，如何客观衡量大语言模型（LLM）代 …

8个月前高效码农

RLVER：用可验证情感奖励强化学习训练共情AI代理引言：当AI拥有情感智慧想象一下，当你向AI倾诉工作压力时，它不仅能分析问题，还能精准捕捉你话语背后的失落感，像挚友般回应：”我能感 …

8个月前高效码农

MEM1：让AI在复杂任务中更高效思考的突破性方法什么是长周期AI代理？在日常使用智能助手时，你可能经历过这样的场景：先问”最新显卡参数”，接着追问”哪个型号适 …

8个月前高效码农

Ovis-U1：首个统一理解、生成与编辑的多模态AI模型一、突破性技术：三合一AI架构的诞生在人工智能领域，多模态模型正迅速改变人机交互方式。而今天介绍的Ovis-U1，作为Ovis系列的最新突破 …

9个月前高效码农

AI如何像人类一样主动搜索？MMSearch-R1让多模态模型学会”按需查资料” 数据可视化引言：当AI遇到”知识盲区” 想象你正在使用智能助手查询某 …

9个月前高效码农

Odyssey：用开放世界技能赋能 Minecraft 智能体 Minecraft 智能体的革命性突破想象一下：一个 AI 角色在 Minecraft 世界中自主探索、制造钻石剑、与怪物战斗、经营农 …

9个月前高效码农

OpenAI 最新模型升级全解析：o3-pro、GPT-4.1 与语音功能的突破性进展（2025年6月更新）核心摘要：2025年6月，OpenAI 重磅推出专业级模型 o3-pro，显著提升复杂任务 …