Grok 4 重磅发布:两大新模型、256k 上下文和爆表性能

刚刚,Grok 团队推出了全新一代模型——Grok 4 和更强力的 Grok 4 Heavy。这次更新聚焦“推理能力”,彻底剔除了非推理版本,目标直指更高的可靠性和更深度的思考。

核心亮点概览

  • 双模齐发

    • Grok 4(标准版)
    • Grok 4 Heavy(增强版)
  • 全面推理

    • 统一走全链路思考
    • 消除“猜测”与“绕圈”
  • 旗舰级基准成绩

    • ARC‑AGI‑2(PhD 水准考试):

      • Grok 4 搭配工具:44%
      • 上一代 O3 搭配工具:24%
    • AIME(国际数学奥赛选拔):满分 100%

  • 超大上下文窗口

    • 256 000 令牌(tokens)
    • 相比 O3 与 Sonnet 4(200k),提升 28%
  • 全新语音模式

    • 延迟远低于普通 ChatGPT 语音
    • 对话更顺畅、更自然
  • App 订阅新档

    • $300/月,专属 Grok 应用
  • API 升级

    • 内置「搜索工具」——即开即用
    • 现已开放给所有 API 用户
    • 价格:
      | 项目 | 输入费用 | 输出费用 | 适用说明 |
      |——————|——————|——————|——————————————–|
      | Grok 4 | $3/百万 tokens | $15/百万 tokens | 与 Sonnet 4 等价,高于 O3 与 GPT 4.1 |
      | 超过 128k 上下文 | 费用翻倍 | 费用翻倍 | 输入、输出均适用 |
  • 未来预告

    • 专用代码模型
    • 多模态文本+图像
    • 视频生成

为什么要关注 Grok 4?

  1. 更可靠的推理能力
    以往轻量版模型常因速度和准确度折衷出现“无解”或“答不上来”的情况,如今全部推理引擎直通到底,链路清晰,让结果更可信。

  2. 超级上下文
    256k 令牌能一次性读完整本手册、法律合同或长篇日志,省去拆分回复的麻烦。

  3. 基准成绩碾压
    在 PhD 级别的 ARC‑AGI‑2 和 AIME 考试里横扫对手,再次刷新行业天花板。

  4. 内置搜索工具
    API 端点直接调研,无需额外接驳外部搜索服务,能快捷获取最新数据。

  5. 全家桶生态
    语音、代码、多模态、视频……Grok 将逐步构建一整套 AI 能力,让开发者用一个帐号就能打通所有场景。


常见问题(FAQ)

Q1:什么是“推理专用”模型?

A:Grok 4 系列取消了所有不进行深度链式思考的轻量版,每一次调用都运行完整推理流程,确保回答过程可追溯、结果更严谨。

Q2:256k 的上下文窗口具体能做什么?

A:等同于一次性输入≈200页文档、长达数万行日志或多本电子书。适合法律、科研、小说、长文档批注等场景。

Q3:API 嵌入的搜索工具如何使用?

A:在请求参数中启用 search 模式,即可自动调用内置工具完成网络检索,无需自行搭建爬虫或搜索层。

Q4:128k 令牌后价格为何翻倍?

A:超大上下文窗口的计算与存储成本显著提升,超出 128k后输入、输出都按原价 2 倍计费,建议针对性分批处理或预算预留。

Q5:后续的代码、多模态和视频模型何时上线?

A:官方表示将在 未来几个月陆续发布,预计分阶段开放,请持续关注 Grok 官方公告。


通过这次发布,Grok 4 系列不仅性能再攀新高,也为开发和研究场景提供了更全面、易用的工具链,无论是深度推理、海量上下文,还是脚本生成,都有一站式解决方案。敬请体验,并在实际项目中探索它的极限!