Universal Deep Research:重新定义自主研究代理的灵活性与控制力 本文欲回答的核心问题 “能否构建一个既支持高度自定义研究策略、又兼容任意大语言模型的研究系统,而不需重新训练或微调 …
Stock GPT:用自然语言对话管理库存的智能助手 在库存管理领域,我们经常面临这样的困境:需要快速查询库存状态,却被复杂的数据库查询语言所阻碍。Stock GPT的出现彻底改变了这一现状,它是一款 …
I. 摘要与概述 LongCat-Flash-Thinking 是一个高效的开源大型推理模型,由美团 LongCat 团队开发。它总参数量达到 5600 亿,但平均激活参数仅为 270 亿,这得益于创 …
在人工智能技术迅猛发展的今天,大模型的能力边界不断拓展,但其安全性与合规性也日益成为行业关注的焦点。今天我们要介绍的 DeepSeek-R1-Safe,正是为了解决这一难题而诞生的创新解决方案。 什么 …
近期,大型语言模型(LLMs)的快速发展推动了深度研究(DR)代理的兴起。这些代理展现出令人惊叹的能力,包括生成新颖的想法、高效检索信息、执行实验以及撰写综合报告和学术论文。 目前,大多数公开的 DR …
WiFi信号实现人体姿态估计:技术原理与未来展望 引言 在计算机视觉领域,通过摄像头、激光雷达(LiDAR)和雷达进行人体姿态估计的技术已经取得显著进展。然而,这些方法面临诸多挑战: 摄像头:受光照和 …
ROMA:让多智能体“套娃”式协作像搭积木一样简单 把“复杂任务拆到原子级”这件事做成框架,30 秒上手,5 分钟写出第一个专属 Agent。 本文要回答的核心问题 ROMA 到底是什么? 它如何把“ …
在人工智能迅猛发展的今天,各类大模型层出不穷,如何从众多模型中选出一款既“聪明”又高效,并且价格合理的模型,已成为许多开发者和企业关注的重点。xAI 推出的 Grok 4 Fast 作为一款强调推理能 …
ParaThinker:原生并行思考——大语言模型推理能力的新突破 本文欲回答的核心问题 大语言模型在提升推理能力时,为何会遇到性能瓶颈?如何通过新的计算范式突破这一限制?ParaThinker作为一 …
大型语言模型中的解决方案聚合:多数投票并非总是正确 大家好,如果你对大型语言模型(LLM)感兴趣,想知道如何让它们在解决复杂问题时更聪明一些,那你来对地方了。最近我一直在思考这个问题,特别是通过生成多 …
在数字媒体爆炸式增长的今天,音频和视频内容的转录需求日益增加。无论是会议记录、讲座整理还是播客内容转化,自动语音识别(ASR)技术都扮演着关键角色。然而,许多ASR服务对音频长度和大小设置了严格限制, …
你有没有想过,如何用一段视频的动作和表情,让一张静态的角色图片“活”起来?或者,你好奇怎么在视频中替换角色,同时保持场景的灯光和色调一致?如果这些问题听起来耳熟,那你来对地方了。今天,我们来聊聊Wan …
Memori:为大型语言模型构建类人记忆的智能引擎 前言:当AI学会记忆 想象一下这样的场景:当你与AI助手讨论项目需求时,它记得你上周提到的技术栈偏好;当你咨询代码问题时,它了解你正在使用的框架版本 …
为什么强化学习微调“忘性”更小?一篇说透 RL’s Razor 原理与实战 核心问题:同样把模型微调到一个新任务,为什么强化学习(RL)比监督微调(SFT)更能保住老本? 一句话答案:RL …
“ 关键词:LEGO 加速器、自动生成 RTL、空间加速器、张量应用、AI 芯片设计、Gemmini 对比、数据流融合、MIT Han Lab 一句话先给答案 LEGO 是 MIT Han Lab 2 …
摘要 DeepSeek-R1 是 DeepSeek-AI 团队提出的一种基于强化学习(Reinforcement Learning, RL)的大语言模型(LLM),其核心目标是通过 RL 框架激励模型 …
目录 引言 为什么研究“漫画幽默” PixelHumor 数据集的诞生 数据来源 幽默风格分类 标注流程 数据分析 实验设计与任务设置 幽默识别 幽默分类 幽默解释 顺序识别 实验结果 识别幽默:容易 …
Set Block Decoding:让大语言模型推理速度提升3-5倍的新方法 一、背景:语言模型推理为什么需要加速? 大家在用大语言模型聊天或写代码时,有没有遇到过这样的尴尬: 输出一长段代码时卡顿 …
Hermes 4 14B:更强大、更易用的开源大语言模型 在人工智能迅猛发展的今天,大语言模型(LLM)已成为推动技术进步的核心力量。无论是进行复杂的逻辑推理,还是辅助日常的创意写作,一个能力强、易操 …
——Meta Reality Labs 与卡内基梅隆大学联合开源的通用度量三维重建模型 一、为什么需要“通用”三维重建? 过去要做一套**度量级(metric)**三维场景,得把 pipeline 拆 …