MiniCPM-V 4.0与MiniCPM-o 2.6:端侧多模态大模型的新标杆 在人工智能技术飞速发展的今天,多模态大模型正逐渐成为连接数字世界与现实世界的桥梁。不同于传统的单一模态模型,多模态大模 …
Claude Opus 4.1 正在 Anthropic 内部测试:我们该怎么理解这次「小版本升级」? 更新时间:2025-08-05 一张图看懂全文 ┌─────────────────────── …
两年交付 70 多个 AI 智能体后,我留下的 16 条笔记 “ 写给想用 AI 做产品的你,也写给正在做产品的我自己 开场白:为什么值得你花 10 分钟读完这篇文章? 过去 24 个月,我带着团队把 …
Qwen-Image:突破文本渲染极限的20B多模态图像大模型 阿里巴巴通义千问团队最新发布的20B参数图像基础模型,在复杂文本渲染和精准图像编辑领域实现重大突破 为什么Qwen-Image引起广泛关 …
突破固定长度限制:扩散大语言模型的动态自适应去噪技术 核心突破:DAEDAL技术首次实现扩散大语言模型的动态可变长度生成,性能媲美甚至超越固定长度模型,同时显著提升计算效率 🔍 研究背景:扩散大语言模 …
开源订阅管理系统:轻松管理你的订阅服务 为什么我们需要订阅管理系统? 在数字化生活日益普及的今天,各种订阅服务如雨后春笋般涌现。从视频流媒体到云存储,从音乐平台到软件服务,我们平均每人拥有12项订阅服 …
浙江大学”悟空”类脑计算机:探索神经拟态计算的新里程碑 8月2日,浙江大学脑机智能全国重点实验室正式发布了新一代神经拟态类脑计算机——Darwin Monkey(” …
用两种老师教一个模型:Agentic-R1 如何让数学题既快又准? “ 关键词:Agentic-R1、DualDistill、工具调用、长链推理、数学推理、代码执行、模型蒸馏 classroom wi …
大型语言模型推理技术解析:从基础到前沿 一、什么是LLM推理? LLM推理是指大型语言模型通过生成中间思考过程来解决复杂问题的能力。就像人类解题需要分步骤思考一样,模型通过生成中间 tokens 来完 …
Lumo:为隐私而生的AI助手 人工智能(AI)正以前所未有的速度改变我们的生活和工作方式。从日常的任务规划到复杂的分子建模,AI展现出巨大的潜力。然而,随着AI能力的增强,一个不容忽视的问题也随之而 …
Gemini 2.5 Deep Think:当AI开始深入思考 Gemini 2.5 Deep Think 现已对 Ultra 订阅用户开放!它在处理需要创造力和规划的问题时表现出色,通过同时考虑、修 …
Step3 是怎么把 3210 亿参数的大模型跑得比 370 亿的还便宜? 通俗版技术博客:读完你就知道 Step3 为什么「大却省钱」,以及它的代码和模型该怎么用。 1. 先讲结论:为什么值得花时间 …
可控视频生成:技术原理与应用场景全解析 引言:为什么视频生成需要”可控性”? 在短视频平台蓬勃发展的今天,AI生成视频技术正在改变内容创作方式。但你是否遇到过这样的困境:输入一 …
代码生成也能像图片扩散一样快?——字节跳动 Seed Diffusion 实测笔记 更新时间:2025 年 8 月 1 日 “ 想象一下:你写一句需求,模型在 1 秒内就给出 2000 多行可用的 P …
认识 Cogito v2 预览版:自我进化的下一代大模型 本文由 DeepCogito 团队发布,完整介绍其全新开源的 Cogito v2 系列模型。这些模型通过创新的“自我改进”机制,显著提升了核心 …
个人超智能:迈向“人人的AI助手”时代 Meta CEO马克·扎克伯格7月30日发布公开信,提出公司未来愿景:打造每个人都能使用的“个人超级智能”AI系统。扎克伯格表示,AI正在以可见但缓慢的步伐自我 …
NeuralAgent:你的桌面AI助手,不只是聊天,更能实干! NeuralAgent工作场景 什么是NeuralAgent?一个真正能”动手做事”的AI助手 在AI助手层出 …
用 500 美元就能跑通的视频生成新范式:Pusa V1.0 通俗全指南 读完本文,你将知道: Pusa 是什么,为什么它能用 4 000 条样例、500 美元预算,就打败需要 1 000 万条样例、 …
AI Mode在搜索中的新方式:让学习与探索更智能高效 “ 谷歌搜索里面的 AI Mode 大幅更新,基本上都快跟 Gemini 功能拉齐了 开始支持上传图片和 PDF 进行提问 增加 Canvas …