让视频模型“活”成世界:LongVie 2 的 5 分钟长镜头魔法 “ 一句话回答:LongVie 2 用三阶段训练把 14 B 参数扩散模型改造成可连续生成 3–5 分钟可控视频的「世界模型」,在 …
MemFlow:如何让AI生成的长视频不再“失忆”?一项突破性记忆机制详解 你是否曾用AI生成视频,却苦恼于它无法记住几秒前的内容?比如,让AI生成一段“一个女孩在公园散步,然后她坐在长椅上阅读”的视 …
2025年大模型发展回顾:六大范式变迁与未来启示 2025年的大模型领域,已不再是单纯追求参数规模的竞赛,而是转向对智能形态、训练方法与应用范式的深刻重塑。 2025 LLM Year in Revi …
Agent Skills:为AI代理添加专业能力的开放标准 想象一下,你的AI助手就像一个工具箱。基础工具能完成日常任务,但遇到专业问题时,就需要特殊工具。Agent Skills就是这样一个标准化系 …
本地运行大型语言模型(LLM)的终极指南:开源工具、平台和资源大全 在人工智能时代,大型语言模型(LLM)如ChatGPT和Claude已成为日常工具。但你知道吗?通过本地运行LLM,你可以实现完全隐 …
“ 关键词:Seedance 1.5pro、音视频联合生成、AI 视频模型、唇形同步、中文方言、Diffusion Transformer 开场白:为什么“带声音的视频”突然成了新战场? 过去一年,A …
HyperVL:让手机也能流畅运行的多模态大模型,是怎么做到的? 你是否曾幻想过,在你的手机上,有一个像ChatGPT一样聪明的助手,不仅能和你聊天,还能“看懂”你相册里的照片、理解屏幕截图、甚至帮你 …
探索OpenPhone:轻量级移动代理基础模型如何重塑AI手机未来 摘要 OpenPhone是一个开源的3B参数代理基础模型,专为智能手机本地运行设计,解决云API依赖带来的隐私、延迟和成本问题。它通 …
Scone模型:当AI学会“看图挑人”,图像生成进入精准构图新时代 Snippet Scone模型解决了主题驱动图像生成中的关键难题——在多候选目标的复杂参考图中,精准识别并生成指令指定的目标主体。它 …
HY-World 1.5(也称为WorldPlay)是一个开源的实时交互世界建模系统,能够以24 FPS的速度生成具有长期几何一致性的流式视频。它通过双重动作表示、重构上下文记忆、WorldCompa …
小米MiMo-V2-Flash:309B参数的高效AI大模型深度解析 「摘要」:小米MiMo-V2-Flash是一款采用混合专家架构的大语言模型,拥有309B总参数量但仅激活15B参数,通过128-t …
★Code Wiki 全面指南:用AI彻底改变代码理解与协作★ 在软件开发的世界里,理解一个庞大而陌生的代码库往往是最耗时、最令人望而生畏的任务。无论是新员工入职、开源项目贡献,还是技术选型调研,开发 …
“ 你是否想过,从一张简单的2D图片到一个细节丰富、材质逼真的3D模型,最快需要多长时间?微软研究院的最新答案令人震惊:最快仅需约3秒。让我们一同深入探索这项颠覆性技术背后的核心奥秘。 摘要 TREL …
AI竞赛进入危险阶段:GPT 5.2与Gemini 3的生态决战 还记得几年前,人工智能的每一次突破都让我们兴奋不已。新的模型诞生,性能基准被刷新,演示视频在网络上疯传,未来仿佛充满了无限可能。每一次 …
“ 核心问题:同样 30 B 量级的开源模型,为什么 Nemotron-3-Nano 在数学、代码、工具调用、长上下文等任务上更快、更准,还能把显存占用砍到一半以下? 先给答案 它把“大模型”拆成 1 …
摘要 A2UI是一个开源项目,允许AI代理通过JSON描述生成安全、跨平台的UI界面,适用于动态数据收集、远程协作等场景[^1.1^][^2.2^]。本文将从核心原理、架构设计、实践应用到入门指南展开 …
摘要 Fun-ASR是通义实验室推出的端到端语音识别大模型,基于数千万小时真实语音数据训练,支持31种语言识别,准确率高达93%,适用于高噪声环境。本文深入解析其核心特性、环境安装步骤、推理使用方法及 …
如何将Sliding Window Attention Adaptation应用到你的LLM项目中 摘要 Sliding Window Attention Adaptation (SWAA) 是一种实 …
VITRA 全景速览:用百万段“野生”人手视频把机器人预训练做到 6 厘米级精度 核心问题:没有昂贵遥操作,也没有实验室脚本,仅凭网上随手拍的人手视频,能不能把机器人“教”到开箱即用的程度? 一句话答 …
MLE-Agent:您的智能伙伴,让AI工程与研究无缝衔接 在机器学习与人工智能飞速发展的今天,无论是经验丰富的研究员还是正在成长的工程师,都面临着一个共同的挑战:如何将创新的想法高效、可靠地转化为可 …