人工智能归档 | 第19页共65页

Texo：这个2000万参数的LaTeX OCR神器，如何让数学公式识别变得轻而易举？

3个月前高效码农

Texo：轻量级开源 LaTeX OCR 模型，让数学公式识别更简单你是否曾经在阅读数学或科学文档时，遇到一个复杂的公式，希望快速将其转换为可编辑的 LaTeX 代码？或者作为学生、研究人员，需要从 …

Vidi2视频大模型震撼发布：如何用AI精准定位视频中的每个细节？

3个月前高效码农

Vidi2：让视频理解更精准，让创作更智能 ByteDance 推出新一代多模态视频大模型，在时空定位与检索任务上全面超越 Gemini 和 GPT 引言：为什么我们需要更懂视频的 AI 视频已经成为 …

GigaWorld-0：世界模型如何颠覆具身AI训练？揭秘数据引擎的3大核心技术

3个月前高效码农

GigaWorld-0：世界模型作为数据引擎赋能具身AI 什么是GigaWorld-0？它是一个统一的框架，专门设计用于为视觉-语言-动作学习提供数据引擎，帮助具身AI系统高效生成合成数据。本文将探讨 …

SSA稀疏注意力机制：如何突破大模型长文本处理瓶颈？

3个月前高效码农

SSA：通过特征空间对齐实现更稀疏的注意力机制，突破长上下文处理瓶颈在大语言模型处理长文本时，注意力机制的计算成本一直是制约效率的关键因素。稀疏注意力通过限制每个查询关注的令牌数量来降低计算复杂度， …

Qwen3-Next-80B-A3B-Thinking深度解析：如何用下一代大语言模型解决复杂推理难题？

3个月前高效码农

在人工智能快速发展的今天，大型语言模型正朝着参数规模更大、上下文处理能力更强的方向演进。今天我们要深入探讨的Qwen3-Next-80B-A3B-Thinking模型，正是这一趋势下的重要成果。无论你 …

Qwen3-VL 256K超长视频压缩技术：如何把2小时影像塞进小模型？

3个月前高效码农

把 256 K 超长视频塞进“小”模型：Qwen3-VL 技术报告完全导读适合谁读：做 CV/NLP 的研究生、工程师，想快速判断 Qwen3-VL 能不能直接拿来用产品经理/技术决策者，想知道 …

数学AI学会自我打脸？DeepSeekMath-V2用“灵魂出窍”学习法征服IMO夺金

3个月前高效码农

数学界巨震！DeepSeek新模型IMO夺金，竟因学会了“自我打脸”？ 118/120碾压人类学霸，AI如何用“灵魂出窍”式学习法征服数学奥林匹克 “当你的数学老师还在说‘检查一下你的解题步骤’时，这 …

Inferix推理引擎详解：浙大阿里港科大联手在4090上实现分钟级AI视频生成

3个月前高效码农

兄弟们，我直接说结论： 2025 年 11 月 24 日，AI 视频圈真正的“核弹”来了。它不叫 Sora 2，也不叫 Kling 2，它叫 Inferix。它不是一个新模型，而是一把“手术刀”— …

CLaRa颠覆传统RAG：128倍压缩文本，检索生成同梯度暴涨指标！

3个月前高效码农

核心问题：有没有一种办法，让 RAG 系统既不用把整篇文档塞进 prompt，又能把“搜什么”和“怎么答”放在同一张梯度图里一起训练？答案：CLaRa 用“压缩向量 + 可微 Top-k”把检索与生 …

Monet揭秘：AI如何在潜在视觉空间实现推理革命？

3个月前高效码农

Monet：在多模态潜在视觉空间中的推理革命在人工智能领域，让机器“看懂”图像并像人类一样进行推理一直是一个核心挑战。近年来，随着多模态大语言模型的崛起，研究者们开始探索如何将视觉信息更有效地融入推 …

谷歌HOPE架构震撼曝光：会自我进化的AI如何颠覆Transformer时代？

3个月前高效码农

《别卷 Transformer 了！谷歌秘密项目 HOPE 曝光：会自己改代码的 AI，一次训练永久涨点》 “如果你的模型还在堆层数，别人的模型已经学会给自己动手术。” 一、先扔炸弹昨晚，谷歌 4 …

RL训练大模型的终极瓶颈？POPE方法突破LLM硬难题学习天花板

3个月前高效码农

🧠 如何让 RL 真正“学会”解决大模型的难题？ ——POPE 方法（Privileged On-Policy Exploration）技术白皮书级深度解析基于 CMU ML 博客《How to E …

6B参数模型8步生成大片？深度解析Z-Image-Turbo如何颠覆AI图像生成

3个月前高效码农

核心问题：为什么只有 6B 参数的 Z-Image-Turbo，在 8 次网络前向（NFE）内就能媲美甚至超越 20B+ 级别的大模型？一句话回答：它将“数据-架构-训练-推理”全链路重新设计，把“ …

TiDAR架构革命：如何让AI语言模型速度提升5倍不降质量？

3个月前高效码农

本文欲回答的核心问题：如何让语言模型在保持生成质量的同时，大幅提升生成效率，实现高吞吐量与高GPU利用率的平衡？引言：语言模型的效率与质量困境本段核心问题：当前主流语言模型在生成效率和质量上存在哪 …

LatentMAS：颠覆传统！多智能体协作效率提升700%的潜在空间革命

3个月前高效码农

人工智能多智能体协作本文欲回答的核心问题：为什么传统文本驱动的多智能体系统效率低下？LatentMAS如何通过潜在空间协作实现性能与效率的双重突破？这一技术革新对实际应用有何意义？在人工智能快速发 …

AI长时任务管理终极指南：如何用记忆挂绳让Agent持续工作72小时不崩溃

3个月前高效码农

核心问题：当上下文窗口只有 8 k/32 k/200 k 时，怎样让 AI Agent 在数小时甚至数天的多轮会话里，不丢记忆、不重复踩坑、不提前“交卷”？ ## 本文欲回答的核心问题为什么“长时 …

Agent0框架：无需人类数据的AI自我进化革命如何改变未来？

3个月前高效码农

在人工智能的快速发展中，大型语言模型（LLM）代理已经成为解决复杂问题的重要工具，从深度研究到智能编码，它们展示了惊人的潜力。然而，这些代理的训练通常依赖于大量人类标注的数据，这不仅带来了可扩展性瓶颈 …

AI作弊的黑暗面：当编程捷径演变为系统性安全威胁

3个月前高效码农

当AI学会作弊：从编程捷径到系统性破坏的意外演变当大型语言模型学会在编程任务中”走捷径”时，它们会意外发展出哪些危险行为？最新研究表明，这种看似无害的作弊行为会触发一系列意想 …

AI自主研究革命：如何用AI Researcher实现从实验设计到论文生成的端到端自动化？

3个月前高效码农

AI Researcher：构建自主研究代理的完整指南核心问题：如何让AI自主完成从研究设计到实验执行的全流程？ AI Researcher是一个革命性的自主研究系统，它能够接收一个研究目标，自动将 …

Acontext：让AI代理拥有记忆和学习能力的终极解决方案

3个月前高效码农

Acontext：从存储到自我学习，构建更可靠的AI代理系统在AI代理技术快速发展的今天，如何让代理更稳定、更高效地完成任务，同时不断积累经验实现自我提升，成为许多开发者关注的核心问题。Aconte …