翻转对话的艺术:UserLM-8b 如何让 AI 助手面对“真实”的你

14天前 高效码农

想象一下,你是位忙碌的开发者,正调试一个棘手的多轮对话系统。你的 AI 助手在测试中表现完美——它总能猜透你的意图,吐出井井有条的回应。可一到真实用户反馈,那画面就变了:用户懒洋洋地丢出一句半吊子问题 …

Sora MCP Server:用自然语言轻松生成视频,打通AI创作的最后一公里

15天前 高效码农

“ 让每个人都能通过对话创建精彩视频 你是否曾想过,只需要简单地用文字描述,就能生成一段高质量的视频?现在,这不再是科幻电影中的场景。Sora MCP Server的出现,正让这一梦想成为现实。 一、 …

LangGraph实战:6个招式将大模型Token用量从25k砍到11k

28天前 高效码农

“为什么我的上下文越长,答案反而越离谱?” 如果你也在深夜对着 128k 窗口的 GPT-4 怀疑人生,这篇文章就是写给正在抠头的你。 故事从一次“奖励黑客”调研开始 上周,老板甩给我一个看似人畜无害 …

扩散语言模型强化学习新纪元:TraceRL框架如何实现数学推理突破?

1个月前 高效码农

Revolutionizing Reinforcement Learning for Diffusion Language Models: Introducing TraceRL and TraDo …

LLM对齐人类价值观新突破!MVPBench如何用75国数据重塑AI伦理?

1个月前 高效码农

理解MVPBench:一个用于将大型语言模型与多样化人类价值观对齐的基准和微调框架 嗨,大家好,如果你对大型语言模型(LLM)感兴趣,特别是如何让它们更好地适应不同文化和背景下的用户价值观,那你来对地 …

DeepSeek-V3.1-Terminus重磅升级:Agent能力飙升,FP8推理全解析(附本地部署指南)

1个月前 高效码农

TL;DR:DeepSeek-V3.1-Terminus 是 DeepSeek 系列在 V3.1 基础上面向 agent 能力与语言一致性 的一次迭代,强化了 Search Agent / Code …

Stock GPT:用自然语言对话管理库存的AI智能助手

1个月前 高效码农

Stock GPT:用自然语言对话管理库存的智能助手 在库存管理领域,我们经常面临这样的困境:需要快速查询库存状态,却被复杂的数据库查询语言所阻碍。Stock GPT的出现彻底改变了这一现状,它是一款 …

美团开源5600亿参数LongCat-Flash-Thinking模型:如何实现推理效率飞跃?

1个月前 高效码农

I. 摘要与概述 LongCat-Flash-Thinking 是一个高效的开源大型推理模型,由美团 LongCat 团队开发。它总参数量达到 5600 亿,但平均激活参数仅为 270 亿,这得益于创 …

ParaThinker突破AI推理瓶颈:并行思考让小模型秒杀大模型

1个月前 高效码农

ParaThinker:原生并行思考——大语言模型推理能力的新突破 本文欲回答的核心问题 大语言模型在提升推理能力时,为何会遇到性能瓶颈?如何通过新的计算范式突破这一限制?ParaThinker作为一 …

破解LLM难题:AggLM如何用强化学习超越多数投票

1个月前 高效码农

大型语言模型中的解决方案聚合:多数投票并非总是正确 大家好,如果你对大型语言模型(LLM)感兴趣,想知道如何让它们在解决复杂问题时更聪明一些,那你来对地方了。最近我一直在思考这个问题,特别是通过生成多 …

大规模多模态模型能看懂网络漫画幽默吗?PixelHumor数据集揭秘AI笑点盲区

1个月前 高效码农

目录 引言 为什么研究“漫画幽默” PixelHumor 数据集的诞生 数据来源 幽默风格分类 标注流程 数据分析 实验设计与任务设置 幽默识别 幽默分类 幽默解释 顺序识别 实验结果 识别幽默:容易 …

3-5倍提速!Set Block Decoding让大语言模型推理飞起来

1个月前 高效码农

Set Block Decoding:让大语言模型推理速度提升3-5倍的新方法 一、背景:语言模型推理为什么需要加速? 大家在用大语言模型聊天或写代码时,有没有遇到过这样的尴尬: 输出一长段代码时卡顿 …

VoxCPM:无分词器的 TTS 模型,用于高级语音合成

1个月前 高效码农

作者 / 团队 / 机构 作者:Yixuan Zhou、Guoyang Zeng、Xin Liu、Xiang Li、Renjie Yu、Ziyang Wang、Runchuan Ye、Weiyue S …

AIPex:用自然语言掌控浏览器的终极自动化工具

1个月前 高效码农

重新定义浏览器自动化:AIPex 如何用自然语言解放你的双手 浏览器自动化不再是开发者的专属领域。AIPex 作为一款革命性的 Chrome 扩展,通过自然语言命令和人工智能技术,让任何人都能像与助手 …

Tongyi DeepResearch重磅发布:300亿参数智能代理模型如何颠覆深度信息搜索?

1个月前 高效码农

在人工智能快速发展的今天,大型语言模型(LLM)正在逐步改变我们获取和处理信息的方式。然而,面对复杂、开放且需要多步推理的深度信息搜索任务时,传统模型往往显得力不从心。针对这一挑战,Tongyi La …

REFRAG技术突破:AI生成内容提速30倍,长上下文处理效率飙升

1个月前 高效码农

★REFRAG:让AI生成内容更快更高效的新方法★ 你是否遇到过这样的情况:向AI提问时,如果问题需要结合大量背景知识,回答速度就会变慢,甚至卡顿?就像在图书馆里找资料,如果管理员每次都要翻遍所有书架 …

FunAudio-ASR语音识别技术揭秘:实测准确率提升30%,如何实现工业级落地?

1个月前 高效码农

“ 作者:FunAudio 团队 适用人群:计算机、电子、通信、人工智能及相关专业毕业生;对“大模型+语音”落地感兴趣的产品经理与工程团队 阅读收益:30 min 搞懂一套可直接上线的大模型语音识别方 …

32B参数超越120B!K2-Think模型数学推理性能全解析

1个月前 高效码农

对话式导读 “有没有可能用一张家用显卡,跑出 GPT-4 级别的数学题?” ——有。MBZUAI 最新开源的 K2-Think 只用 32B 参数,就在 AIME 2024/2025、HMMT25、O …

mmBERT重磅升级:1800种语言+8倍速度,如何全面超越XLM-R?

1个月前 高效码农

六年终结者:mmBERT 如何把 1800 种语言塞进一个 2-4 倍快的编码器 “ 核心问题:为什么做了 6 年“基准”的 XLM-R 今天可以被一个同样体量的编码器 mmBERT 全面取代? 答案 …

百度ERNIE-4.5-21B-A3B-Thinking重磅发布:3B激活参数如何挑战万亿模型?

1个月前 高效码农

百度ERNIE-4.5-21B-A3B-Thinking:高效MoE架构引领AI推理模型新趋势 关键词:ERNIE-4.5-21B-A3B-Thinking、百度AI、MoE模型、深度推理、长上下文、 …