9 月 2025 | 第4页共12页

美团开源5600亿参数LongCat-Flash-Thinking模型：如何实现推理效率飞跃？

7个月前高效码农

I. 摘要与概述 LongCat-Flash-Thinking 是一个高效的开源大型推理模型，由美团 LongCat 团队开发。它总参数量达到 5600 亿，但平均激活参数仅为 270 亿，这得益于创 …

DeepSeek-R1-Safe如何重塑AI安全格局？浙大华为联合研发的四大训练流程揭秘

7个月前高效码农

在人工智能技术迅猛发展的今天，大模型的能力边界不断拓展，但其安全性与合规性也日益成为行业关注的焦点。今天我们要介绍的 DeepSeek-R1-Safe，正是为了解决这一难题而诞生的创新解决方案。什么 …

谷歌新突破！TTD-DR深度研究代理如何刷新行业纪录？

7个月前高效码农

近期，大型语言模型（LLMs）的快速发展推动了深度研究（DR）代理的兴起。这些代理展现出令人惊叹的能力，包括生成新颖的想法、高效检索信息、执行实验以及撰写综合报告和学术论文。目前，大多数公开的 DR …

用WiFi信号捕捉人体动作？这项黑科技竟能实现高精度姿态估计！

7个月前高效码农

WiFi信号实现人体姿态估计：技术原理与未来展望引言在计算机视觉领域，通过摄像头、激光雷达（LiDAR）和雷达进行人体姿态估计的技术已经取得显著进展。然而，这些方法面临诸多挑战：摄像头：受光照和 …

Codex CLI 1UP：AI编码助手工具如何颠覆代码重构技巧？

7个月前高效码农

Codex CLI 1UP 使用指南 codex-1up banner 这篇文章将带你完整了解 Codex CLI 1UP —— 一个为 Codex CLI 编码代理扩展强大功能的工具集。本文内容全部 …

ROMA框架：多智能体递归拆分协作的30秒上手指南

7个月前高效码农

ROMA：让多智能体“套娃”式协作像搭积木一样简单把“复杂任务拆到原子级”这件事做成框架，30 秒上手，5 分钟写出第一个专属 Agent。本文要回答的核心问题 ROMA 到底是什么？它如何把“ …

终极AI模型决策指南：Grok 4 Fast真的够聪明高效吗？

7个月前高效码农

在人工智能迅猛发展的今天，各类大模型层出不穷，如何从众多模型中选出一款既“聪明”又高效，并且价格合理的模型，已成为许多开发者和企业关注的重点。xAI 推出的 Grok 4 Fast 作为一款强调推理能 …

Claude Code中文开发套件：中国开发者智能编程工具深度解析

7个月前高效码农

Claude Code 中文开发套件：中国开发者的智能编程助手前言在人工智能技术快速发展的今天，智能编程工具已成为开发者日常工作中不可或缺的助手。Claude Code 中文开发套件专为中国开发者 …

Klear-46B-A2.5B混合专家模型：2.5亿激活参数如何实现算力革命？

7个月前高效码农

Klear-46B-A2.5B：高效能混合专家模型详解一、模型核心特性解析 1. 混合专家架构创新 Klear-46B-A2.5B采用独特的混合专家（MoE）架构，在保持460亿总参数规模的同时，通 …

ParaThinker突破AI推理瓶颈：并行思考让小模型秒杀大模型

7个月前高效码农

ParaThinker：原生并行思考——大语言模型推理能力的新突破本文欲回答的核心问题大语言模型在提升推理能力时，为何会遇到性能瓶颈？如何通过新的计算范式突破这一限制？ParaThinker作为一 …

破解LLM难题：AggLM如何用强化学习超越多数投票

7个月前高效码农

大型语言模型中的解决方案聚合：多数投票并非总是正确大家好，如果你对大型语言模型（LLM）感兴趣，想知道如何让它们在解决复杂问题时更聪明一些，那你来对地方了。最近我一直在思考这个问题，特别是通过生成多 …

Qwen3-ASR-Toolkit突破长音频转录限制：智能分割+并行处理技术揭秘

7个月前高效码农

在数字媒体爆炸式增长的今天，音频和视频内容的转录需求日益增加。无论是会议记录、讲座整理还是播客内容转化，自动语音识别（ASR）技术都扮演着关键角色。然而，许多ASR服务对音频长度和大小设置了严格限制， …

Wan-Animate颠覆行业？AI精准动画生成与无缝角色替换技术全解析

7个月前高效码农

你有没有想过，如何用一段视频的动作和表情，让一张静态的角色图片“活”起来？或者，你好奇怎么在视频中替换角色，同时保持场景的灯光和色调一致？如果这些问题听起来耳熟，那你来对地方了。今天，我们来聊聊Wan …

iPhone秒变本地OCR服务器！零隐私风险的全能文字识别方案

7个月前高效码农

将iPhone变身本地OCR服务器：完全隐私保护的文字识别方案在数字化时代，文字识别技术（OCR）已成为连接物理世界与数字信息的桥梁。然而，大多数OCR服务依赖云端处理，这不仅带来延迟问题，更引发数 …

小米MiMo-Audio 7B震撼发布：语音AI迈入GPT级自由续写时代

7个月前高效码农

“能不能像 GPT-3 写文章那样，随便给两句声音，模型就把剩下的活儿全包圆？” 小米最新开源的 MiMo-Audio 系列，用 1 亿小时无标注语音把这个问题推到了“基本可以”的程度。下面把论文、博 …

Hunyuan3D Studio：把一张图变成游戏级3D资产的「七步流水线」

7个月前高效码农

关键词：Hunyuan3D Studio、3D 资产生成、AI 游戏管线、PBR 贴图、自动拓扑、语义 UV、文字生成 3D、图片生成 3D 适合读者：数字媒体、游戏开发、动画、工业设计、计算机视觉等 …

Notion 3.0 正式发布：用 AI 智能代理告别琐碎工作，专注真正重要的创作

7个月前高效码农

你是否曾希望一天能有 28 个小时？现在，你的 AI 工作伙伴可以帮你实现这个愿望。你是否曾经在周四下午三点，面对一堆待处理的邮件、尚未完成的项目计划，以及散落在各个工具和聊天记录中的关键信息，感到 …

Memori记忆引擎：为大型语言模型注入类人记忆的革命性技术

7个月前高效码农

Memori：为大型语言模型构建类人记忆的智能引擎前言：当AI学会记忆想象一下这样的场景：当你与AI助手讨论项目需求时，它记得你上周提到的技术栈偏好；当你咨询代码问题时，它了解你正在使用的框架版本 …

为什么强化学习微调‘忘性’更小？RL’s Razor原理与实战全解析

7个月前高效码农

为什么强化学习微调“忘性”更小？一篇说透 RL’s Razor 原理与实战核心问题：同样把模型微调到一个新任务，为什么强化学习（RL）比监督微调（SFT）更能保住老本？一句话答案：RL …

LEGO 是什么？一款把“AI 芯片设计”做成搭积木的开源框架

7个月前高效码农

“ 关键词：LEGO 加速器、自动生成 RTL、空间加速器、张量应用、AI 芯片设计、Gemmini 对比、数据流融合、MIT Han Lab 一句话先给答案 LEGO 是 MIT Han Lab 2 …