Grok 4 重磅发布:两大新模型、256k 上下文和爆表性能
刚刚,Grok 团队推出了全新一代模型——Grok 4 和更强力的 Grok 4 Heavy。这次更新聚焦“推理能力”,彻底剔除了非推理版本,目标直指更高的可靠性和更深度的思考。
核心亮点概览
-
双模齐发
-
Grok 4(标准版) -
Grok 4 Heavy(增强版)
-
-
全面推理
-
统一走全链路思考 -
消除“猜测”与“绕圈”
-
-
旗舰级基准成绩
-
ARC‑AGI‑2(PhD 水准考试):
-
Grok 4 搭配工具:44% -
上一代 O3 搭配工具:24%
-
-
AIME(国际数学奥赛选拔):满分 100%
-
-
超大上下文窗口
-
256 000 令牌(tokens) -
相比 O3 与 Sonnet 4(200k),提升 28%
-
-
全新语音模式
-
延迟远低于普通 ChatGPT 语音 -
对话更顺畅、更自然
-
-
App 订阅新档
-
$300/月,专属 Grok 应用
-
-
API 升级
-
内置「搜索工具」——即开即用 -
现已开放给所有 API 用户 -
价格:
| 项目 | 输入费用 | 输出费用 | 适用说明 |
|——————|——————|——————|——————————————–|
| Grok 4 | $3/百万 tokens | $15/百万 tokens | 与 Sonnet 4 等价,高于 O3 与 GPT 4.1 |
| 超过 128k 上下文 | 费用翻倍 | 费用翻倍 | 输入、输出均适用 |
-
-
未来预告
-
专用代码模型 -
多模态文本+图像 -
视频生成
-
为什么要关注 Grok 4?
-
更可靠的推理能力
以往轻量版模型常因速度和准确度折衷出现“无解”或“答不上来”的情况,如今全部推理引擎直通到底,链路清晰,让结果更可信。 -
超级上下文
256k 令牌能一次性读完整本手册、法律合同或长篇日志,省去拆分回复的麻烦。 -
基准成绩碾压
在 PhD 级别的 ARC‑AGI‑2 和 AIME 考试里横扫对手,再次刷新行业天花板。 -
内置搜索工具
API 端点直接调研,无需额外接驳外部搜索服务,能快捷获取最新数据。 -
全家桶生态
语音、代码、多模态、视频……Grok 将逐步构建一整套 AI 能力,让开发者用一个帐号就能打通所有场景。
常见问题(FAQ)
Q1:什么是“推理专用”模型?
A:Grok 4 系列取消了所有不进行深度链式思考的轻量版,每一次调用都运行完整推理流程,确保回答过程可追溯、结果更严谨。
Q2:256k 的上下文窗口具体能做什么?
A:等同于一次性输入≈200页文档、长达数万行日志或多本电子书。适合法律、科研、小说、长文档批注等场景。
Q3:API 嵌入的搜索工具如何使用?
A:在请求参数中启用 search
模式,即可自动调用内置工具完成网络检索,无需自行搭建爬虫或搜索层。
Q4:128k 令牌后价格为何翻倍?
A:超大上下文窗口的计算与存储成本显著提升,超出 128k后输入、输出都按原价 2 倍计费,建议针对性分批处理或预算预留。
Q5:后续的代码、多模态和视频模型何时上线?
A:官方表示将在 未来几个月陆续发布,预计分阶段开放,请持续关注 Grok 官方公告。
通过这次发布,Grok 4 系列不仅性能再攀新高,也为开发和研究场景提供了更全面、易用的工具链,无论是深度推理、海量上下文,还是脚本生成,都有一站式解决方案。敬请体验,并在实际项目中探索它的极限!