MapAnything:把任意照片变成带尺度的 3D 模型,只需一次前向计算

1个月前 高效码农

——Meta Reality Labs 与卡内基梅隆大学联合开源的通用度量三维重建模型 一、为什么需要“通用”三维重建? 过去要做一套**度量级(metric)**三维场景,得把 pipeline 拆 …

HuMo 全景解读:用文本+图片+声音“零演员”拍真人短片

1个月前 高效码农

核心问题:没有专业团队、没有摄影棚,只靠一段文字、一张照片和一段语音,能否在 8 分钟内生成 480P 的口型同步真人视频? 答案:HuMo 开源框架已经做到,且支持 720P、17 亿参数版本,本地 …

Ring-mini-2.0高效推理:16B MoE模型如何突破代码生成与长上下文瓶颈?

1个月前 高效码农

摘要 本文深入解析了 inclusionAI 团队最新发布的 Ring-mini-2.0 模型——一个基于 Ling 2.0 架构深度优化的高性能混合专家模型(MoE)。该模型仅使用 16B 总参数和 …

生成式AI重塑教育:Learn Your Way开启个性化学习新时代

1个月前 高效码农

教材是教育的基石,但它们也有明显的局限性。传统教材往往是一种“一刀切”的模式,需要大量人工编写和编辑,缺乏多样化的表达形式和个性化的学习体验。结果是,许多学生在面对相同的内容时,难以根据自己的兴趣和水 …

斯坦福重磅推出MedAgentBench!医疗AI‘办事员’首次实战测试,70%成功率背后的医疗革命

1个月前 高效码农

长久以来,我们对医疗人工智能的想象,往往停留在它能像一位博学的医生那样,通过考试或回答复杂的医学问题。大型语言模型(LLM)确实在美国医师执照考试(USMLE)等知识问答测试中取得了令人瞩目的成绩。但 …

3倍真实感跃升!腾讯推出Direct-Align+SRPO扩散训练新框架

1个月前 高效码农

一、引言:AI绘画优化的新突破 近年来,扩散模型(Diffusion Models)在图像生成领域取得显著进展,但存在两大核心瓶颈:传统方法依赖多步去噪计算导致训练效率低下,以及离线调整奖励模型难以实 …

2025年ChatGPT使用行为深度解析:AI如何重塑全球数字生活?

1个月前 高效码农

ChatGPT用户增长曲线图 一、全球用户增长趋势 根据OpenAI最新研究数据,ChatGPT自2022年11月发布以来呈现爆发式增长: 2023年12月:月活用户突破1亿 2024年7月:日均消息 …

macOS Tahoe 26:在圆润与灵动之间重塑桌面体验

1个月前 高效码农

今天,苹果正式发布了 macOS 的全新版本——Tahoe 26。这一代系统不仅在功能上持续精进,更在视觉语言、交互逻辑与生态协同方面实现了全面升级。从图标的圆润化到小组件的灵动布局,从游戏生态的初步 …

VideoX-Fun:一站式视频生成与训练工具,轻松实现AI视频创作

1个月前 高效码农

如果你是一名对AI视频生成感兴趣的开发者,或者正在寻找一款能兼顾视频生成、模型训练的工具,那么VideoX-Fun或许能满足你的需求。它是一个功能完整的视频生成pipeline,不仅能直接使用预训练模 …

FireRedTTS-2:多角色长对话语音生成技术如何颠覆播客与实时交互?

1个月前 高效码农

一、为什么需要 FireRedTTS-2? 在传统的文本转语音(TTS)系统中,常见的应用场景是单人播报:例如视频配音、虚拟主播或语音助手。 然而,随着播客和对话型应用的兴起,用户对以下能力提出了更高 …

神速评测!AU-Harness一键解决语音大模型评估痛点?

1个月前 高效码农

语音大模型怎么“打分”?AU-Harness 把复杂 benchmark 装进一个开源工具箱 如果你只想知道结论 AU-Harness = 一套用 Python 写的开源脚本,能把 50+ 语音数据集 …

32B参数超越120B!K2-Think模型数学推理性能全解析

1个月前 高效码农

对话式导读 “有没有可能用一张家用显卡,跑出 GPT-4 级别的数学题?” ——有。MBZUAI 最新开源的 K2-Think 只用 32B 参数,就在 AIME 2024/2025、HMMT25、O …

弱模型如何监控强AI?揭秘LLM智能体红队测试新框架

1个月前 高效码农

当“弱”模型监督“强”智能体:一套可落地的 LLM 监控红队框架 ❝ 关键词:LLM 智能体监控、红队测试、弱-强监督、CUA-SHADE-Arena、混合脚手架、真阳性率 ❞ 一、为什么要操心“智能 …

震惊!这款自动化求职工具竟让面试邀约暴涨300%?

1个月前 高效码农

Get Jobs:自动化求职工具,让找工作更高效 引言:如何解决求职投递效率低的痛点? 在当前竞争激烈的就业市场中,求职者每天需要花费大量时间在多个招聘平台重复投递简历,却常常面临回复率低、效率低下的 …

RSL协议如何颠覆AI数据许可?破解训练数据管理三大痛点

1个月前 高效码农

AI数据许可新篇章:RSL协议如何重塑训练数据管理 一、AI训练数据困局:一场未被解决的许可证战争 在人工智能飞速发展的今天,全球每天有超过2亿条数据被标注用于训练模型。然而根据MIT媒体实验室202 …

百度ERNIE-4.5-21B-A3B-Thinking重磅发布:3B激活参数如何挑战万亿模型?

1个月前 高效码农

百度ERNIE-4.5-21B-A3B-Thinking:高效MoE架构引领AI推理模型新趋势 关键词:ERNIE-4.5-21B-A3B-Thinking、百度AI、MoE模型、深度推理、长上下文、 …

大模型基准测试陷信任危机?动态评估成破局关键!

1个月前 高效码农

大模型基准测试的最新进展:从静态到动态评估 图片来源:项目原始文件 本文要回答的核心问题 在大语言模型(LLM)的快速发展背景下,为什么数据污染(data contamination)成为亟需解决的问 …

MacBook盖子角度传感器全攻略:教你玩转LEGO蝙蝠侠彩蛋!

1个月前 高效码农

  你的 MacBook 里藏着一扇“会吱呀作响”的隐形门:Lid Angle Sensor 完全指南 作者:Sam Gold(署名 Lisa 的开发者) 改写:技术白话译者 把电脑屏幕缓缓 …

甩开MyFitnessPal!这款开源健身追踪神器让你掌握数据主权

1个月前 高效码农

SparkyFitness:开源自主托管,MyFitnessPal 的替代方案 Fitness Tracking Application 在现代社会,健康与健身已经成为越来越多人关注的重点。随着科技的 …

Apertus-70B-2509:700亿参数开源大模型如何颠覆全球AI格局?

1个月前 高效码农

Apertus-70B-2509:开启全球语言环境的开放大模型新时代 图片来源:Apertus官方技术文档 本文核心问题:如何在保障数据合规性的同时,构建一个真正开放且支持全球语言的大型语言模型? 在 …