百度ERNIE 4.5震撼发布:10款大模型开启多模态新纪元 一、全景图:424B参数刷新行业纪录 百度正式开源文心ERNIE 4.5系列,一次性推出10款参数规模不同的模型,覆盖从0.3B到424B …
高效部署大语言模型:盘古 Embedded 与 Pro MoE 实践指南 在大语言模型(LLM)日益广泛应用的今天,推理效率与部署成本成为制约其落地的重要因素。华为盘古团队针对昇腾(Ascend)NP …
WorldVLA:革新机器人操作的统一视觉-语言-动作模型 机器人与AI交互场景 引言:机器人智能化的新突破 在工业自动化和智能制造领域,机器人操作一直面临着感知-决策-执行的多维度挑战。传统机器人系 …
深度研究代理:AI如何改变科研与信息处理 AI agent working with multiple screens 引言:AI研究的新范式 2025年,大语言模型(LLM)的发展催生了一种新型自主 …
TC-Light:解决长视频动态重光照的时间一致性与计算效率难题 引言:视频重光照的挑战与机遇 在数字内容创作和人工智能领域,视频重光照(Video Relighting) 是一项关键技术。它能改变视 …
Pickaxe: 开发 AI 代理的利器 在这个 AI 风起云涌的时代,开发一个强大的 AI 代理绝非易事。不仅要关注核心算法,还得操心任务调度、错误处理、资源分配等等一系列复杂的系统性问题。今天,我 …
一文读懂知识图谱推理:技术原理与应用场景 什么是知识图谱推理? 知识图谱推理(Knowledge Graph Reasoning, KGR)是人工智能领域的关键技术之一,其核心目标是通过已有的知识图谱 …
腾讯开源130亿激活参数大模型Hunyuan-A13B全面解析 引言:高效智能的突破性选择 在人工智能领域,大型语言模型(LLMs)正推动自然语言处理、计算机视觉等技术的革命性进步。腾讯最新开源的Hu …
Qwen3 从零实现:轻松上手大型语言模型 在人工智能快速发展的今天,大型语言模型(LLM)已成为科技领域的热门话题。Qwen3 0.6B 作为一款从零实现的模型,为开发者提供了一个深入了解和使用大型 …
AI如何像人类一样主动搜索?MMSearch-R1让多模态模型学会”按需查资料” 数据可视化 引言:当AI遇到”知识盲区” 想象你正在使用智能助手查询某 …
vLLM:下一代大模型推理引擎如何重塑AI应用开发 引言:当千亿美元市场遇见技术瓶颈 根据IDC最新报告,全球AI推理市场规模预计2025年突破$1200亿。然而传统推理引擎面临三大困境 …
任务导向型知识图谱推理技术全解析:现状、应用与未来趋势 一、知识图谱推理技术的核心价值 在人工智能领域,知识图谱被誉为”机器认知的骨架”。这种结构化知识存储方式,通过实体-关系 …
Stream-Omni:开启多模态交互新时代 在人工智能快速发展的今天,我们正见证着一个全新的多模态交互时代的到来。Stream-Omni,这个融合了语言、视觉和语音的大型模型,正在重新定义我们与机器 …
wav2graph:语音数据到知识图谱的突破性学习框架 语音信号中蕴含丰富信息,如何有效提取结构化知识是关键挑战 在人工智能领域,语音数据作为最自然的人机交互形式,蕴含着丰富的语义信息。传统方法主要关 …
突破视觉问答的认知边界:知识与视觉笔记如何增强多模态大模型推理能力 引言:视觉问答的认知挑战 在当今信息爆炸的时代,视觉问答(VQA)系统需要像人类一样理解图像内容并回答复杂问题。然而,现有的多模态大 …
生成式推荐系统的新突破:DiscRec 框架详解 在当今数字化时代,推荐系统已成为各大互联网平台的核心技术之一。从电商平台到流媒体平台,推荐系统通过精准地为用户推荐感兴趣的商品或内容,不仅提升了用户体 …
突破大规模语言模型训练瓶颈:AREAL异步强化学习系统解析 Asynchronous AI Training System 引言:强化学习面临的系统挑战 在大型语言模型(LLM)训练领域,强化学习(R …
LangCoop:重新定义人机协同的未来出行方式 引言:当机器学会”读心术” 想象这样一个场景:当您驾驶车辆行驶在城市道路上,车载系统不仅能实时感知周围车辆动向,还能通过自然语 …
OmniGen2:开启多模态生成模型的新纪元 多模态AI模型正在改变我们与数字内容交互的方式 引言:人工智能的新里程碑 在人工智能领域,多模态模型正迅速成为技术发展的前沿。今天,我将带您深入了解一款革 …
Align Your Flow:流图蒸馏技术的突破与应用 生成模型图像 引言 在人工智能的世界里,生成模型正以前所未有的速度改变着我们的生活。从栩栩如生的图像到根据文字生成的画面,这些技术让我们仿佛置 …