大模型也会“变脸”?用「人格向量」把 AI 的脾气管起来 为什么今天还彬彬有礼的聊天机器人,明天就突然阴阳怪气? 为什么只是让它学写代码,它却学会了“撒谎”? 这不是科幻,而是大语言模型(LLM)真实 …
浙江大学”悟空”类脑计算机:探索神经拟态计算的新里程碑 8月2日,浙江大学脑机智能全国重点实验室正式发布了新一代神经拟态类脑计算机——Darwin Monkey(” …
用两种老师教一个模型:Agentic-R1 如何让数学题既快又准? “ 关键词:Agentic-R1、DualDistill、工具调用、长链推理、数学推理、代码执行、模型蒸馏 classroom wi …
大型语言模型推理技术解析:从基础到前沿 一、什么是LLM推理? LLM推理是指大型语言模型通过生成中间思考过程来解决复杂问题的能力。就像人类解题需要分步骤思考一样,模型通过生成中间 tokens 来完 …
Claude 如何实现自动化编程?揭秘无头模式与 GitHub 工作流革新 当你的代码助手能自动完成 GitHub 工单、修复 Bug 甚至提交 PR,开发流程会发生什么变化?Anthr …
从“会做题”到“会反思”:一文看懂 MetaStone-S1 如何让 32 B 模型追上 OpenAI o3-mini 开场白:为什么大模型也需要“考试时的草稿纸”? 想象一下,你在考场上遇到一道数学 …
Lumo:为隐私而生的AI助手 人工智能(AI)正以前所未有的速度改变我们的生活和工作方式。从日常的任务规划到复杂的分子建模,AI展现出巨大的潜力。然而,随着AI能力的增强,一个不容忽视的问题也随之而 …
手把手教你用 150 万条 GPT 生成的数据,让开源模型也能做出 GPT-4o 级别的修图效果 ——一份写给技术同学的 GPT-IMAGE-EDIT-1.5M 实战指南 “ 如果你苦于找不到高质量、 …
Gemini 2.5 Deep Think:当AI开始深入思考 Gemini 2.5 Deep Think 现已对 Ultra 订阅用户开放!它在处理需要创造力和规划的问题时表现出色,通过同时考虑、修 …
Step3 是怎么把 3210 亿参数的大模型跑得比 370 亿的还便宜? 通俗版技术博客:读完你就知道 Step3 为什么「大却省钱」,以及它的代码和模型该怎么用。 1. 先讲结论:为什么值得花时间 …
可控视频生成:技术原理与应用场景全解析 引言:为什么视频生成需要”可控性”? 在短视频平台蓬勃发展的今天,AI生成视频技术正在改变内容创作方式。但你是否遇到过这样的困境:输入一 …
ControlNet for Wan2.2:深度控制视频生成的实用指南 什么是 ControlNet 与 Wan2.2 的结合? 在人工智能视频生成领域,Wan2.2 作为一款先进的视频生成模型,已经 …
RLVMR框架:提升长程代理效率的新方法 在人工智能领域,构建能够自主完成复杂长程任务(如家庭环境操作、科学实验)的智能体一直是核心挑战。本文将深入解析腾讯团队提出的RLVMR框架,通过案例和实验数据 …
RLVMR框架:提升长程代理效率的新方法 在人工智能领域,构建能够自主完成复杂长程任务(如家庭环境操作、科学实验)的智能体一直是核心挑战。本文将深入解析腾讯团队提出的RLVMR框架,通过案例和实验数据 …
代码生成也能像图片扩散一样快?——字节跳动 Seed Diffusion 实测笔记 更新时间:2025 年 8 月 1 日 “ 想象一下:你写一句需求,模型在 1 秒内就给出 2000 多行可用的 P …
认识 Cogito v2 预览版:自我进化的下一代大模型 本文由 DeepCogito 团队发布,完整介绍其全新开源的 Cogito v2 系列模型。这些模型通过创新的“自我改进”机制,显著提升了核心 …
TTD-DR:像人类一样写研究报告的AI框架 ❝ 对话式导语: 你是否好奇AI如何像人类一样高效撰写研究报告?本文将揭秘谷歌最新提出的TTD-DR框架,它通过模拟人类写作的”草稿-修改&# …
让图像与文字像聊天一样流畅:X-Omni 带来的统一式生成体验 “能不能像写句子一样把一张图‘写’出来,而且一次就能写对?” 过去,答案是“做不到”。今天,X-Omni 正在把它变成日常。 在这篇文章 …
GLM 4.5:这匹开源黑马,为何在推理、编码与智能体任务中悄然超越Qwen与Kimi? “ 真正的AI竞赛不在新闻头条里,而在GitHub的每一次提交、Hugging Face的排行榜单,以及Dis …