百度ERNIE-4.5-21B-A3B-Thinking重磅发布:3B激活参数如何挑战万亿模型?

7天前 高效码农

百度ERNIE-4.5-21B-A3B-Thinking:高效MoE架构引领AI推理模型新趋势 关键词:ERNIE-4.5-21B-A3B-Thinking、百度AI、MoE模型、深度推理、长上下文、 …

Apertus-70B-2509:700亿参数开源大模型如何颠覆全球AI格局?

10天前 高效码农

Apertus-70B-2509:开启全球语言环境的开放大模型新时代 图片来源:Apertus官方技术文档 本文核心问题:如何在保障数据合规性的同时,构建一个真正开放且支持全球语言的大型语言模型? 在 …

从零掌握Mixture of Experts模型:moellama项目实战全攻略

18天前 高效码农

从零开始理解Mixture of Experts语言模型:moellama项目实战指南 你是否曾经好奇,大型语言模型是如何在保持高效的同时不断提升性能的?随着AI技术的快速发展,传统的单一网络架构已经 …

手机端性能猛兽!MiniCPM-V 4.5如何实现GPT-4o级视觉语言处理?

23天前 高效码农

MiniCPM-V 4.5:手机可运行的GPT-4o级多模态模型——全面解析与实用指南 如果你正在寻找一款既能在手机上流畅运行,又具备GPT-4o级别视觉语言能力的多模态模型,那么面壁最新推出的Min …

Deca 3 Alpha Ultra震撼发布:4.6万亿参数如何颠覆AI行业?

27天前 高效码农

Deca 3 Alpha Ultra:重新定义大型语言模型的未来 在人工智能飞速发展的今天,大型语言模型(LLM)已经成为推动技术边界的重要力量。它们不仅在研究和工业应用中表现卓越,也逐步融入我们的日 …

震惊!字节跳动开源360亿参数模型:长文本无敌,数学题吊打Qwen3?

29天前 高效码农

一口气看懂 ByteDance Seed-OSS 36B:为什么大家都在聊它? 如果你刚打开这篇博客,可能正在搜索“Seed-OSS 36B 是什么”“怎么在本地跑起来”“值不值得用”——这篇文章一次 …

XBai o4开源模型引爆AI界:普通服务器实现超越OpenAI的深度思考能力

1个月前 高效码农

XBai o4 开源第四代大模型:把“深度思考”装进一台普通服务器 一句话看懂 XBai o4 如果你只想知道一件事: XBai o4 是一套用“反思型生成”技术训练的大模型,能在普通 GPU 上跑出 …

Gemma 3全面指南:手机端部署与高效微调实战技巧

1个月前 高效码农

Gemma 3 全面指南:从本地运行到高效微调 通俗解读谷歌新一代轻量级AI模型的实战应用 🌟 一、Gemma 3 是什么? Gemma 3 是谷歌推出的新一代开源轻量级AI模型家族,基于与Gemin …

阿里云Qwen3-4B模型震撼升级!推理能力超越30B级别,开启AI新纪元

1个月前 高效码农

Qwen3-4B-Thinking-2507:深度思考能力大幅提升的开源大模型 “ 核心突破:阿里云推出全新升级的Qwen3-4B-Thinking-2507模型,在逻辑推理、数学计算、代码生成等复杂 …

手机端多模态AI新纪元:MiniCPM-V 4.0与MiniCPM-o 2.6性能全解析

1个月前 高效码农

MiniCPM-V 4.0与MiniCPM-o 2.6:端侧多模态大模型的新标杆 在人工智能技术飞速发展的今天,多模态大模型正逐渐成为连接数字世界与现实世界的桥梁。不同于传统的单一模态模型,多模态大模 …

OpenAI开源模型gpt-oss爆火!1200亿参数架构、性能、安全全解析

1个月前 高效码农

OpenAI gpt-oss 模型深度解析:架构、安全与性能全面解读 引言 2025年8月5日,OpenAI 正式发布了两款开源大模型 gpt-oss-120b 和 gpt-oss-20b。这两款基于 …

字节跳动Seed Diffusion引爆AI代码生成!速度提升5倍,质量不输AR模型?

1个月前 高效码农

代码生成也能像图片扩散一样快?——字节跳动 Seed Diffusion 实测笔记 更新时间:2025 年 8 月 1 日 “ 想象一下:你写一句需求,模型在 1 秒内就给出 2000 多行可用的 P …

Arcee AFM-4.5B-GGUF技术解析:企业级高效AI模型如何颠覆行业规则?

1个月前 高效码农

深入解析 Arcee AFM-4.5B-GGUF:企业级高效AI模型的技术革新 图:Arcee AFM-4.5B 模型架构示意图 为什么企业需要关注AFM-4.5B? 在企业AI部署中,你是否遇到过这 …