rStar2-Agent: 探索代理推理在数学问题解决中的应用 大家好,我是这篇博客的作者。今天,我想和大家聊聊 rStar2-Agent 这个项目。它是一个专注于代理强化学习(agentic rei …
完全开源语音识别新标杆:OLMoASR模型训练与应用指南 为什么需要开源的语音识别模型? 在人工智能领域,语音识别技术正深刻改变人机交互方式。然而大多数先进模型仍是闭源的”黑箱” …
探索Hermes 4:一个结合推理和指令跟随的混合模型家族 你好!如果你对大型语言模型(LLM)感兴趣,尤其是那些能处理复杂推理任务的同时又保持通用能力的模型,那么Hermes 4可能会让你眼前一亮。 …
Chain-of-Agents:让AI像团队一样协作完成任务的新范式 Figure 1: AFM在多个基准测试中表现优异 引言:当AI学会”团队协作” 想象你正在策划一场大型活 …
Gemini GPT Hybrid:本地与云端的混合式 AI 工具包详解 AI fusion illustration 在人工智能应用快速发展的今天,很多开发者面临一个选择: 是依赖本地算力运行轻量化 …
Kronos:面向金融市场的开源基础模型全解析 金融市场的数据从来都不简单。每天都有成千上万的价格波动、成交量、买卖单交织在一起,形成了一幅看似随机却暗藏规律的图景。对量化研究者和数据科学家来说,如何 …
MiniCPM-V 4.5:手机可运行的GPT-4o级多模态模型——全面解析与实用指南 如果你正在寻找一款既能在手机上流畅运行,又具备GPT-4o级别视觉语言能力的多模态模型,那么面壁最新推出的Min …
Osaurus:在 Mac 上跑本地大模型的新选择——超轻量、纯原生、兼容 OpenAI 更新时间:2025-08-26 如果你有一台 M 系列芯片的 Mac,想把大模型装到本地、随时离线使用,又嫌 …
量子机器学习AI代理:让量子计算轻松解决现实问题 “ IBM全球导师计划2025项目成果:无需Qiskit专业知识,自动生成优化量子机器学习代码 量子机器学习示意图 为什么需要量子机器学习助手? 当量 …
如何用LLM Reasoner让大语言模型拥有类人推理能力:技术详解与实践指南 你是否好奇前沿AI系统如OpenAI的o1或深度求索的R1如何实现深度推理?今天我们将解析一个能赋予普通大语言模型(LL …
从零开始读懂 DeepSeek-V3.1:一份给技术新人的混合推理模型说明书 “ 如果你刚拿到一台新电脑,拆箱后第一件事是翻说明书; 如果你第一次接触 DeepSeek-V3.1,这篇文字就是你的“说 …
XBai o4 开源第四代大模型:把“深度思考”装进一台普通服务器 一句话看懂 XBai o4 如果你只想知道一件事: XBai o4 是一套用“反思型生成”技术训练的大模型,能在普通 GPU 上跑出 …
DeepSeek V3.1 发布:更长上下文、更强推理,AI 开源竞赛进入新阶段 更长的上下文窗口、更强的推理能力,以及更优的成本效益——DeepSeek V3.1 正在重新定义开源大模型的竞争力。 …
探索Coursera课程总结:我的学习笔记和资源分享 在学习在线课程的过程中,我发现保持笔记和总结是一个有效的办法,能帮助我回顾知识并加深理解。这个仓库就是我为Coursera上完成的课程和专项课程创 …
机器学习:从基础到应用的全景解析 一、监督学习:让模型从标注数据中学习 1. 线性回归:建立变量间的线性关系 1.1 基础概念 线性回归是最基础的预测模型,通过建立自变量(特征)与因变量(目标)之间的 …
# 让大模型记住看过的视频、听懂你说的话:M3-Agent 长记忆多模态智能体实战指南 > 本文基于 ByteDance Seed 团队开源的 M3-Agent 项目撰写,确保真实可靠。 如果你 …
Gemma 3 全面指南:从本地运行到高效微调 通俗解读谷歌新一代轻量级AI模型的实战应用 🌟 一、Gemma 3 是什么? Gemma 3 是谷歌推出的新一代开源轻量级AI模型家族,基于与Gemin …
让 AI 像“人”一样对话:SOTOPIA-RL 如何让大模型学会真正的社交智慧? “机器能算题,能写诗,但能不能像朋友一样陪你商量‘今晚要不要加班’?” ——本文将带你拆解 SOTOPIA-RL,一 …
深入解析AA-LCR:评估大模型长文本推理能力的关键基准 在人工智能快速发展的今天,大语言模型处理和理解长文本的能力越来越受关注。无论是分析多份公司报告、梳理法律文件中的复杂关系,还是从政府政策文档中 …
用 AI 帮你把搜索算法变快:CRINN 实战指南 ❝ “为什么我的向量数据库越来越慢?” “有没有办法让 ANNS 算法自动优化?” “训练好的模型还能再提速吗?” ❞ 如果你也问过类似问题,这篇文 …