人工智能归档 | 第14页共64页

ChatGPT应用生态重磅开放：一篇读懂开发者如何抢跑与用户使用全攻略

3个月前高效码农

ChatGPT应用生态开放：开发者提交指南与用户使用全解析摘要 OpenAI正式开放ChatGPT应用提交通道，开发者可通过Apps SDK构建应用并提交审核。用户可在内置应用目录中发现、连接并@提 …

OpenPhone重塑AI手机：首款3B轻量模型如何解决隐私与延迟？

3个月前高效码农

探索OpenPhone：轻量级移动代理基础模型如何重塑AI手机未来摘要 OpenPhone是一个开源的3B参数代理基础模型，专为智能手机本地运行设计，解决云API依赖带来的隐私、延迟和成本问题。它通 …

别再乱堆智能体了！论文揭示：180组实验发现“人多坏事”的惊人边界

3个月前高效码农

多智能体系统一定更强？180 组实验告诉你“人多”何时反而坏事 “ 核心问题：把模型从 1 个拉到 9 个，到底什么任务会涨点、什么任务会翻车？一句话答案：任务能拆、工具不多、单基线低于 45 % …

Scone模型彻底解决AI“看图挑人”难题：多主体图像生成准确率提升40%

3个月前高效码农

Scone模型：当AI学会“看图挑人”，图像生成进入精准构图新时代 Snippet Scone模型解决了主题驱动图像生成中的关键难题——在多候选目标的复杂参考图中，精准识别并生成指令指定的目标主体。它 …

ChatGPT图像生成惊天升级：4倍速神器详解，精准编辑引爆创作革命

3个月前高效码农

OpenAI最新推出的ChatGPT Images模型不仅在生成速度上提升了4倍，更在细节处理和编辑精度上实现了技术突破。如果你正在寻找一款能够理解复杂指令并生成高质量图像的人工智能工具，今天有个重 …

HY-World 1.5革命性深度解析：如何用开源框架实现24FPS的实时交互世界建模？

3个月前高效码农

HY-World 1.5（也称为WorldPlay）是一个开源的实时交互世界建模系统，能够以24 FPS的速度生成具有长期几何一致性的流式视频。它通过双重动作表示、重构上下文记忆、WorldCompa …

多模态生成式推理（MMGR）大揭秘：为什么Sora做不对数独、穿墙而过还自认合理？

3个月前高效码农

多模态生成式推理到底测什么？ ——一份给普通人的 MMGR 技术说明书如果你只想知道结论，可以直接跳到最后「一分钟速读」。如果你想弄懂“为什么我的 AI 视频总穿墙、数独填错格、迷宫走到死胡同”， …

小米MiMo-V2-Flash重磅发布：309B参数如何实现2.6倍推理加速与代码智能体新巅峰？

3个月前高效码农

小米MiMo-V2-Flash：309B参数的高效AI大模型深度解析「摘要」：小米MiMo-V2-Flash是一款采用混合专家架构的大语言模型，拥有309B总参数量但仅激活15B参数，通过128-t …

PersonaLive测评：单卡实时肖像动画，直播网红的新生产力工具

3个月前高效码农

PersonaLive：实时流式肖像动画的突破性框架摘要 PersonaLive是一款基于扩散模型的肖像动画框架，能在单张12GB GPU上实现实时、可流式传输的无限长度肖像动画，兼具低延迟与高质量 …

Vibe Coding 指南：如何与AI结对编程，将你的想法快速变成可维护的代码现实

3个月前高效码农

你有没有过这样的经历？脑子里有一个绝妙的想法，比如开发一个多人在线游戏或一个高效的数据处理工具，但一想到从零开始规划、写代码、调试，就觉得头大？别担心，今天我们来聊聊Vibe Coding——一个通过 …

从黑盒到玻璃盒：AI Agent质量评估失败？四支柱飞轮模型给你答案

3个月前高效码农

从黑盒到玻璃盒：AI Agent 质量评估的“四梁八柱”与飞轮 “ 核心问题：当 AI Agent 的输出不再唯一、路径不再确定，我们拿什么说服自己“它可以上线”？本文欲回答的核心问题为什么传统 …

Obsidian终极AI工作流：用ChatGPT MD打造你的私人智能知识库

3个月前高效码农

在 Obsidian 中构建你的私人 AI 工作流：ChatGPT MD 完全指南你是否设想过，在一个你完全信任的私人笔记空间里，直接与世界上最强大的语言模型对话？无论是调用云端最新的 GPT-5， …

3秒生成3D模型！微软4B大模型TRELLIS.2全面揭秘，革新图像到3D生成

3个月前高效码农

“ 你是否想过，从一张简单的2D图片到一个细节丰富、材质逼真的3D模型，最快需要多长时间？微软研究院的最新答案令人震惊：最快仅需约3秒。让我们一同深入探索这项颠覆性技术背后的核心奥秘。摘要 TREL …

GPT 5.2对决Gemini 3：AI竞赛进入最危险阶段，我们正在让渡思考的控制权？

3个月前高效码农

AI竞赛进入危险阶段：GPT 5.2与Gemini 3的生态决战还记得几年前，人工智能的每一次突破都让我们兴奋不已。新的模型诞生，性能基准被刷新，演示视频在网络上疯传，未来仿佛充满了无限可能。每一次 …

性能翻盘！揭秘Nemotron-3-Nano：30B大模型如何用3B计算量碾压对手？

3个月前高效码农

“ 核心问题：同样 30 B 量级的开源模型，为什么 Nemotron-3-Nano 在数学、代码、工具调用、长上下文等任务上更快、更准，还能把显存占用砍到一半以下？先给答案它把“大模型”拆成 1 …

Fun-ASR语音识别：高达93%准确率，如何用这款国产大模型干掉噪音与多语种难题？

3个月前高效码农

摘要 Fun-ASR是通义实验室推出的端到端语音识别大模型，基于数千万小时真实语音数据训练，支持31种语言识别，准确率高达93%，适用于高噪声环境。本文深入解析其核心特性、环境安装步骤、推理使用方法及 …

Sliding Window Attention Adaptation：不用重训！让你的LLM轻松应对万语长文

3个月前高效码农

如何将Sliding Window Attention Adaptation应用到你的LLM项目中摘要 Sliding Window Attention Adaptation (SWAA) 是一种实 …

VITRA颠覆机器人预训练：6厘米精度！百万段野生人手视频“喂”出开箱即用的通用智能

3个月前高效码农

VITRA 全景速览：用百万段“野生”人手视频把机器人预训练做到 6 厘米级精度核心问题：没有昂贵遥操作，也没有实验室脚本，仅凭网上随手拍的人手视频，能不能把机器人“教”到开箱即用的程度？一句话答 …

颠覆VAE：SVG-T2I用DINOv3语义空间直接生成图像，图像AI迎来统一表示时代

3个月前高效码农

SVG-T2I：告别VAE，在视觉基础模型的语义空间里直接生成图像你是否想过，AI生成图像的“魔法”背后，隐藏着一道关键的“压缩”工序？传统的主流方法，如Stable Diffusion，都依赖于一 …

Claude服务中断80分钟深度复盘：一张错误的路由表如何搞瘫AI大脑？

3个月前高效码农

Claude服务中断深度解析：从网络配置故障到全面恢复的技术复盘摘要 2025年12月14日，Claude Opus 4.5及Sonnet模型因网络路由配置错误导致服务中断80分钟（太平洋时间13: …