AGI 只是起点,ASI 才是终极目标:解读吴泳铭在云栖大会的“长线炸弹”

1个月前 高效码农

“AGI 只是起点,ASI 才是终极目标。” ——阿里云 CEO 吴泳铭,云栖大会开场演讲 一年一度的 云栖大会,向来是观察国内云计算与人工智能方向的风向标。 今年,阿里云 CEO 吴泳铭的开场,就直 …

asXiv:利用人工智能轻松探索和理解学术论文的智能工具

1个月前 高效码农

在学术研究的世界里,每天都有成千上万的新论文出现在arXiv等预印本服务器上。对于研究人员、学生和任何对科学前沿感兴趣的人来说,快速理解和评估这些论文的价值是一项巨大的挑战。这就是asXiv诞生的原因 …

BentoML llm-optimizer:彻底改变大语言模型推理性能调优的开源工具

1个月前 高效码农

在大语言模型(LLM)推理部署的过程中,许多开发团队面临一个共同难题:如何在不依赖繁重的手动试错的情况下,为延迟、吞吐量和成本找到最优配置?BentoML 最新发布的 llm-optimizer 正是 …

扩散语言模型强化学习新纪元:TraceRL框架如何实现数学推理突破?

1个月前 高效码农

Revolutionizing Reinforcement Learning for Diffusion Language Models: Introducing TraceRL and TraDo …

Qwen3-LiveTranslate-Flash:实时多模态翻译新纪元——看懂、听懂、说懂,无缝跨越语言壁垒

1个月前 高效码农

嘿,朋友们!想象一下,你正坐在一个国际会议的角落里,台上泰语演讲者滔滔不绝,你却能实时听到流利的中文翻译,甚至还能通过屏幕上的字幕和手势“看懂”那些细微的笑点。听起来像科幻?不,这已经是2025年的现 …

Qwen-Image-Edit-2509:AI图像编辑工具的革命性升级

1个月前 高效码农

一、从传统PS到AI时代的跨越——我们为什么需要Qwen-Image-Edit-2509? 想象一下这样的场景:设计师需要为产品海报添加虚拟模特,摄影师想将两张不同场景的人物照片融合成对话画面,插画师 …

Qwen3-TTS-Flash发布:17种音色+9大方言的中文TTS革命

1个月前 高效码农

“ 一句话先给结论:这是 2025 年最便宜、最快速、方言最多的中文 TTS,没有之一。读完你能: ① 用 3 行代码让北京大爷给你读热搜;② 用 5 行脚本批量生成 17 种音色的短视频配音;③ 把 …

Qwen3-Omni 全面解析:阿里通义千问发布的全能多模态大模型

1个月前 高效码农

引言:为什么说Qwen3-Omni是AI领域的”全能选手”? 还记得那些只能处理文字的传统AI模型吗?它们就像只会一种乐器的音乐家,虽然技艺精湛,但表现力有限。而现在,阿里通义 …

自主研究代理革命:UDR如何实现无需微调的全自定义研究策略

1个月前 高效码农

Universal Deep Research:重新定义自主研究代理的灵活性与控制力 本文欲回答的核心问题 “能否构建一个既支持高度自定义研究策略、又兼容任意大语言模型的研究系统,而不需重新训练或微调 …

美团开源5600亿参数LongCat-Flash-Thinking模型:如何实现推理效率飞跃?

1个月前 高效码农

I. 摘要与概述 LongCat-Flash-Thinking 是一个高效的开源大型推理模型,由美团 LongCat 团队开发。它总参数量达到 5600 亿,但平均激活参数仅为 270 亿,这得益于创 …

DeepSeek-R1-Safe如何重塑AI安全格局?浙大华为联合研发的四大训练流程揭秘

1个月前 高效码农

在人工智能技术迅猛发展的今天,大模型的能力边界不断拓展,但其安全性与合规性也日益成为行业关注的焦点。今天我们要介绍的 DeepSeek-R1-Safe,正是为了解决这一难题而诞生的创新解决方案。 什么 …

用WiFi信号捕捉人体动作?这项黑科技竟能实现高精度姿态估计!

1个月前 高效码农

WiFi信号实现人体姿态估计:技术原理与未来展望 引言 在计算机视觉领域,通过摄像头、激光雷达(LiDAR)和雷达进行人体姿态估计的技术已经取得显著进展。然而,这些方法面临诸多挑战: 摄像头:受光照和 …

ParaThinker突破AI推理瓶颈:并行思考让小模型秒杀大模型

1个月前 高效码农

ParaThinker:原生并行思考——大语言模型推理能力的新突破 本文欲回答的核心问题 大语言模型在提升推理能力时,为何会遇到性能瓶颈?如何通过新的计算范式突破这一限制?ParaThinker作为一 …

破解LLM难题:AggLM如何用强化学习超越多数投票

1个月前 高效码农

大型语言模型中的解决方案聚合:多数投票并非总是正确 大家好,如果你对大型语言模型(LLM)感兴趣,想知道如何让它们在解决复杂问题时更聪明一些,那你来对地方了。最近我一直在思考这个问题,特别是通过生成多 …

Wan-Animate颠覆行业?AI精准动画生成与无缝角色替换技术全解析

1个月前 高效码农

你有没有想过,如何用一段视频的动作和表情,让一张静态的角色图片“活”起来?或者,你好奇怎么在视频中替换角色,同时保持场景的灯光和色调一致?如果这些问题听起来耳熟,那你来对地方了。今天,我们来聊聊Wan …

iPhone秒变本地OCR服务器!零隐私风险的全能文字识别方案

1个月前 高效码农

将iPhone变身本地OCR服务器:完全隐私保护的文字识别方案 在数字化时代,文字识别技术(OCR)已成为连接物理世界与数字信息的桥梁。然而,大多数OCR服务依赖云端处理,这不仅带来延迟问题,更引发数 …

LEGO 是什么?一款把“AI 芯片设计”做成搭积木的开源框架

1个月前 高效码农

“ 关键词:LEGO 加速器、自动生成 RTL、空间加速器、张量应用、AI 芯片设计、Gemmini 对比、数据流融合、MIT Han Lab 一句话先给答案 LEGO 是 MIT Han Lab 2 …

Chrome重磅升级!Gemini AI全面接入,这10大智能功能将颠覆你的上网习惯?

1个月前 高效码农

你是否曾经在打开无数个标签页后感到迷失?是否希望浏览器能更懂你,帮你自动完成那些繁琐的线上任务?现在,这一切正在成为现实。 2025年9月18日,Chrome 进行了其有史以来最大规模的升级,将 Go …

DeepSeek-R1:通过强化学习激励大语言模型推理能力

1个月前 高效码农

摘要 DeepSeek-R1 是 DeepSeek-AI 团队提出的一种基于强化学习(Reinforcement Learning, RL)的大语言模型(LLM),其核心目标是通过 RL 框架激励模型 …

大规模多模态模型能看懂网络漫画幽默吗?PixelHumor数据集揭秘AI笑点盲区

1个月前 高效码农

目录 引言 为什么研究“漫画幽默” PixelHumor 数据集的诞生 数据来源 幽默风格分类 标注流程 数据分析 实验设计与任务设置 幽默识别 幽默分类 幽默解释 顺序识别 实验结果 识别幽默:容易 …