FastTD3:简单、快速、强大的人形机器人强化学习方案 摘要:FastTD3 基于 TD3 算法,通过并行模拟、大批次更新和分布式评论家等优化,在单块 A100 GPU 上 3 小时内即可完成多种人 …
AgentScope 1.0:让AI智能体开发更简单的开源框架 引言:AI智能体的进化之路 想象你有一个能自动订机票、查股票、甚至写报告的AI助手。这些看似科幻的功能,正随着大语言模型(LLM)的进化 …
探索 3D AI 桌面伴侣 Agent Party:功能、安装与使用全指南 你是否想象过拥有一个既能陪你聊天、又能帮你控制智能家居,甚至还能一键部署到微信、QQ 的 AI 桌面伙伴?今天我们要介绍的 …
探索 TeXlyre:本地优先的 LaTeX 协作实用指南 你是否曾经需要和同事一起编辑 LaTeX 文档,却担心数据控制权丢失或网络不稳定?TeXlyre 就是为此而生的。它是一个专为 LaTeX …
VibeVoice:突破性长对话文本转语音模型,重新定义语音合成体验 在人工智能蓬勃发展的今天,文本转语音(Text-to-Speech, TTS)技术正逐渐融入我们的日常生活。无论是智能助手的有声回 …
LL3M:大型语言模型如何自动生成高质量3D模型?技术解析与案例展示 引言:AI如何重塑3D建模? 在计算机图形学领域,生成可编辑的3D模型始终是核心挑战。传统方法依赖大量3D数据训练生成模型,但存在 …
从零开始读懂 DeepSeek-V3.1:一份给技术新人的混合推理模型说明书 “ 如果你刚拿到一台新电脑,拆箱后第一件事是翻说明书; 如果你第一次接触 DeepSeek-V3.1,这篇文字就是你的“说 …
AutoGLM:你的手机通用智能助手,开启全端智能新体验 在当今的移动互联网时代,我们每天都在和手机、电脑以及各种应用打交道。打开一个 App、搜索一个信息、订一份外卖、预订一个酒店房间,甚至写一份报 …
DeepSeek V3.1 发布:更长上下文、更强推理,AI 开源竞赛进入新阶段 更长的上下文窗口、更强的推理能力,以及更优的成本效益——DeepSeek V3.1 正在重新定义开源大模型的竞争力。 …
Ovis2.5:一张图告诉你,为什么它能在小模型里做大事情 对话式阅读指南,写给准备上手或正在评估多模态大模型的你 开场白:先弄清楚三个问题 你可能的疑问 一句话回答 Ovis2.5 是什么? 阿里巴 …
用 Markdown 写 Google Slides:deck 工具完全上手 “ “别人花 1 小时排版,我 3 分钟写完就能去喝咖啡。” 如果你也经常被做 PPT 折磨,deck 可能会成为你的新宠 …
Chaterm:下一代终端管理工具革命 引言:当终端遇上智能革命 在数字化浪潮席卷的今天,企业IT运维人员正面临前所未有的挑战:成千上万台异构设备的管理、海量日志的分析、突发故障的快速响应… …
从空白开始:R-Zero 如何让大模型自己学会推理 “零数据” 不再意味着零能力。本文用工程师的直白语言带你走完 R-Zero 的完整流程:原理、实验结果、动手步骤,以及你可能会踩的坑。 什么是 R- …
dots.vlm1:新一代开源多模态视觉语言模型深度解析 dots.vlm1 引言 在人工智能领域,多模态模型正成为连接视觉与语言理解的关键桥梁。今天,我们荣幸地介绍dots.vlm1——dots模型 …
ROVI 数据集:用AI视觉大模型重新标注百万图像,开启开放词汇文本生成图像新纪元 无需人工标注,结合视觉大模型与语言大模型的力量,ROVI为AI生成图像提供了前所未有的精准对象定位能力。本文详解这一 …
Win11Debloat:一键清理 Windows 11 的终极指南 你是否曾因 Windows 11 中恼人的预装软件和隐私问题而烦恼?现在只需一个脚本即可彻底解决这些困扰! 为什么你需要 Win1 …
深入解析通义千问3-Coder-30B-A3B:下一代编程专用AI助手 ❝ 想象一下,当你面对十万行代码库时,AI能瞬间理解整个项目结构并精准修改;当你需要实现复杂算法时,它能生成可直接运行的工业级代 …
用自然语言问数据库:Wren AI 入门到实践 让不会写 SQL 的人也能在 3 分钟内拿到图表和洞察 这篇文章能帮你解决什么? 场景 传统做法 Wren AI 做法 公司周报要一张“过去 30 天付 …
真实测评:四款 AI Agent 谁最靠谱?——9 个任务 300 分钟实测笔记 目录 为什么又要测 AI Agent? 9 个任务 & 4 款 Agent 速览 测试结果总表( …