人工智能归档 | 第4页共24页

手把手教你从零训练自己的语言模型：在笔记本上复现LLM全部流程

2个月前高效码农

从零训练一个“小”语言模型：llm-madness 完全实操指南 “ 把实验室里那套“高大上”的 LLM 流程，装进一台普通笔记本里 ” 先回答你最想问的 3 个问题问题一句话答案这玩意能干嘛？ …

2025年大语言模型革命性重塑：分析RLVR与私有数据新战略

3个月前高效码农

2025年大语言模型全景回顾：技术演进、实践反思与未来路径核心问题：2025年大语言模型领域发生了哪些关键变化？ 2025年，大语言模型的发展没有放缓迹象，但进步方式发生了根本性转变。单纯的模型参数 …

2025年大型语言模型革命：推理崛起、成本暴跌，AI如何重塑未来工作？

3个月前高效码农

2025年大型语言模型回顾：推理崛起、成本下降与未来展望 2025年即将结束，这无疑是人工智能领域，特别是大型语言模型（LLM）发展历程中又一个里程碑式的年份。如果你感觉技术进步的步伐不仅没有放缓，反 …

MAI-UI突破：首个让AI真正看懂并操作手机界面的GUI Agent，解决四大落地难题

3个月前高效码农

MAI-UI：让 AI 真正”看懂”并”操作”手机界面的突破性 GUI Agent 本文核心问题：为什么现有的 GUI Agent 无法在真实场景中可靠 …

谷歌AI生态大揭秘：官方MCP服务器，让你的助手秒变全能管家！

3个月前高效码农

解锁谷歌AI生态：全面解析谷歌官方Model Context Protocol (MCP) 服务器指南你是否曾设想过，让你的人工智能助手直接为你查询实时地图信息、分析海量企业数据，甚至管理云端 Ku …

BetterClaude Gateway：自动修复 Claude API 工具调用错误的智能代理方案

3个月前高效码农

本文欲回答的核心问题：当 Claude API 因消息历史中的孤儿工具结果块返回 400 错误时，如何在不修改客户端代码的前提下实现自动修复与无缝恢复？在使用 Claude 构建复杂 AI 应用时 …

告别WebDriver噩梦！AI时代的浏览器自动化工具Vibium如何让你效率飙升？

3个月前高效码农

Vibium 是专为 AI 代理设计的浏览器自动化基础设施，采用单一 Go 二进制文件管理浏览器生命周期、WebDriver BiDi 协议及 MCP 服务器。它支持零配置的 Chrome 控制，提供 …

解密QwenLong-L1.5：如何让大模型真正“记住”百万字文档并深度推理？

3个月前高效码农

探索 QwenLong-L1.5：长上下文推理与内存管理的后训练秘诀摘要 QwenLong-L1.5 基于 Qwen3-30B-A3B-Thinking 构建，通过系统后训练创新实现长上下文推理能力 …

GLM-4.7编码助手：如何凭借AI革命让你的开发效率飙升？

3个月前高效码农

GLM-4.7：全面提升的编码助手，为你的开发工作赋能摘要 GLM-4.7是一款进阶的编码助手，在多语言代理编码、终端任务、UI设计、工具使用及复杂推理等方面较前代GLM-4.6有显著提升，本文详解 …

用LongVie 2的5分钟长镜头“魔法”，让AI视频告别“短命”和“失控”

3个月前高效码农

让视频模型“活”成世界：LongVie 2 的 5 分钟长镜头魔法 “ 一句话回答：LongVie 2 用三阶段训练把 14 B 参数扩散模型改造成可连续生成 3–5 分钟可控视频的「世界模型」，在 …

MemFlow突破AI长视频失忆魔咒：60秒角色不变脸的秘密武器

3个月前高效码农

MemFlow：如何让AI生成的长视频不再“失忆”？一项突破性记忆机制详解你是否曾用AI生成视频，却苦恼于它无法记住几秒前的内容？比如，让AI生成一段“一个女孩在公园散步，然后她坐在长椅上阅读”的视 …

2025大模型范式巨浪！六大AI革命颠覆人类认知

3个月前高效码农

2025年大模型发展回顾：六大范式变迁与未来启示 2025年的大模型领域，已不再是单纯追求参数规模的竞赛，而是转向对智能形态、训练方法与应用范式的深刻重塑。 2025 LLM Year in Revi …

Agent Skills开放标准：3步为你的AI代理装上“精密工具”

3个月前高效码农

Agent Skills：为AI代理添加专业能力的开放标准想象一下，你的AI助手就像一个工具箱。基础工具能完成日常任务，但遇到专业问题时，就需要特殊工具。Agent Skills就是这样一个标准化系 …

别再依赖云端！本地LLM部署终极指南：开源工具、实战教程与硬件选型一文通晓

3个月前高效码农

本地运行大型语言模型（LLM）的终极指南：开源工具、平台和资源大全在人工智能时代，大型语言模型（LLM）如ChatGPT和Claude已成为日常工具。但你知道吗？通过本地运行LLM，你可以实现完全隐 …

Seedance 1.5pro技术拆解：AI如何把剧本直接变成带对白的电影？

3个月前高效码农

“ 关键词：Seedance 1.5pro、音视频联合生成、AI 视频模型、唇形同步、中文方言、Diffusion Transformer 开场白：为什么“带声音的视频”突然成了新战场？过去一年，A …

HyperVL黑科技揭秘：手机能跑的多模态大模型，三大神技让GPT-4o变小！

3个月前高效码农

HyperVL：让手机也能流畅运行的多模态大模型，是怎么做到的？你是否曾幻想过，在你的手机上，有一个像ChatGPT一样聪明的助手，不仅能和你聊天，还能“看懂”你相册里的照片、理解屏幕截图、甚至帮你 …

OpenPhone重塑AI手机：首款3B轻量模型如何解决隐私与延迟？

3个月前高效码农

探索OpenPhone：轻量级移动代理基础模型如何重塑AI手机未来摘要 OpenPhone是一个开源的3B参数代理基础模型，专为智能手机本地运行设计，解决云API依赖带来的隐私、延迟和成本问题。它通 …

Scone模型彻底解决AI“看图挑人”难题：多主体图像生成准确率提升40%

3个月前高效码农

Scone模型：当AI学会“看图挑人”，图像生成进入精准构图新时代 Snippet Scone模型解决了主题驱动图像生成中的关键难题——在多候选目标的复杂参考图中，精准识别并生成指令指定的目标主体。它 …

HY-World 1.5革命性深度解析：如何用开源框架实现24FPS的实时交互世界建模？

3个月前高效码农

HY-World 1.5（也称为WorldPlay）是一个开源的实时交互世界建模系统，能够以24 FPS的速度生成具有长期几何一致性的流式视频。它通过双重动作表示、重构上下文记忆、WorldCompa …

小米MiMo-V2-Flash重磅发布：309B参数如何实现2.6倍推理加速与代码智能体新巅峰？

3个月前高效码农

小米MiMo-V2-Flash：309B参数的高效AI大模型深度解析「摘要」：小米MiMo-V2-Flash是一款采用混合专家架构的大语言模型，拥有309B总参数量但仅激活15B参数，通过128-t …