一句话摘要 AlphaEvolve把Gemini变成会写代码、会自己改代码、还能越改越好的“算法炼丹炉”,已在谷歌内部把数据中心闲置算力捞回0.7%,并让4×4复矩阵乘法停滞56年的纪录首次降到48次 …
从模仿到辨别:通用课程优势机制如何提升大模型跨领域推理能力 摘要:本文介绍CAPO(课程优势策略优化),一种创新的强化学习训练范式。它通过分阶段的课程学习,先利用正优势样本进行模仿学习建立稳定基础,再 …
核心问题:如何让AI模型像人类一样拥有长期记忆? 在人工智能发展的今天,我们面临一个根本性挑战:如何让AI模型像人类大脑一样,能够记住并利用长期积累的知识,而不是像金鱼一样只有七秒记忆?本文将深入探讨 …
把 14B 大模型塞进 5 张显卡:LiveAvatar 如何让“数字人”无限时长直播? 日期:2025-12-08 一句话速览 LiveAvatar 用 4 步扩散、流水线并行和“滚动锚帧”技术,把 …
Gemini 3 Pro:当 AI 学会“看”与“想”,多模态智能的范式革命 核心问题:谷歌最新发布的Gemini 3 Pro模型究竟带来了哪些根本性的能力跃迁?它如何超越传统的图像识别,实现真正的视 …
几何奥林匹克竞赛金牌级解题:高效启发式辅助构造的突破 本文核心问题:如何在不依赖神经网络和GPU资源的情况下,实现国际数学奥林匹克竞赛级别的几何问题自动求解能力? 几何定理自动证明是人工智能领域的长期 …
从“记得”到“学得”:Evo-Memory 如何逼 LLM 在测试时自我进化 副标题:一套流式 benchmark + ReMem 框架,让大模型代理把“对话回忆”升级成“经验复用” 核心问题:现有大 …
ViBT:大规模视觉桥接变换器,重新定义条件生成 本文要回答的核心问题:ViBT 到底是什么?它为什么能在图像编辑、视频风格迁移、视频上色、帧插值等任务上,既保持高质量,又比传统扩散模型快 4 倍? …
O-Mem:让AI拥有记忆的革命性系统——个性化智能助手的未来 AI为什么总是”健忘”?这个问题终于有了答案 你有没有这样的经历:和一个AI助手聊了很久,但下次使用时,它完全忘 …
数学界巨震!DeepSeek新模型IMO夺金,竟因学会了“自我打脸”? 118/120碾压人类学霸,AI如何用“灵魂出窍”式学习法征服数学奥林匹克 “当你的数学老师还在说‘检查一下你的解题步骤’时,这 …
兄弟们,我直接说结论: 2025 年 11 月 24 日,AI 视频圈真正的“核弹”来了。 它不叫 Sora 2,也不叫 Kling 2,它叫 Inferix。 它不是一个新模型,而是一把“手术刀”— …
Monet:在多模态潜在视觉空间中的推理革命 在人工智能领域,让机器“看懂”图像并像人类一样进行推理一直是一个核心挑战。近年来,随着多模态大语言模型的崛起,研究者们开始探索如何将视觉信息更有效地融入推 …
人工智能多智能体协作 本文欲回答的核心问题:为什么传统文本驱动的多智能体系统效率低下?LatentMAS如何通过潜在空间协作实现性能与效率的双重突破?这一技术革新对实际应用有何意义? 在人工智能快速发 …
大语言模型的强化学习训练:突破推理能力的新路径 在人工智能领域,大型语言模型(LLM)已经展现出惊人的能力,但如何让这些模型具备更深层次的推理能力,一直是研究者们面临的挑战。最近的研究表明,通过强化学 …
斯坦福智能评审系统:如何用AI将论文反馈周期从6个月缩短到几小时 研究者面临的评审困境 在学术研究领域,论文评审周期过长一直是困扰研究者的核心问题。一位非斯坦福的学生曾经历这样的困境:三年内论文被拒6 …
LLM Council:让多个大语言模型协作输出更全面答案的本地应用 本文欲回答的核心问题:什么是LLM Council?它如何通过整合多个大语言模型(LLM)的能力,为用户提供更深入、更全面的回答? …
2025 年 11 月,上海交大 IPADS 实验室正式开源了 MobiAgent——一个从模型、加速框架到评测基准全部自研的移动端智能体系统。它不是又一个“演示 Demo”,而是目前少数能在真实手机 …
HunyuanVideo-1.5 深度解析:轻量级视频生成模型的技术突破与实践指南 核心问题:当视频生成模型越来越庞大,普通开发者和创作者如何跨越算力鸿沟?HunyuanVideo-1.5 用 8.3 …
深入了解 OLMo 3 32B:一个强大的开源语言模型 OLMo Logo 你是否曾经好奇过,像 ChatGPT 这样的语言模型是如何工作的?或者你想知道如何在自己的项目中利用这些强大的 …
引言:当AI走出聊天框 2025年被称作”代理元年”,但当我们测试了9款顶尖AI模型在真实工作场景的表现后,发现了一个残酷真相——即使是GPT-5和Claude Sonnet …