Claude Opus 4.7 终极实战指南:从 4.6 平滑迁移的十个关键动作
本文旨在回答的核心问题是:面对以“字面理解”著称的 Claude Opus 4.7,我该如何调整提示词与工作流,以避免功能倒退并最大化利用其新增的精确性?
如果你感觉 Claude Opus 4.7 变“笨”了,或者原本在 4.6 上运作完美的提示词突然失效,你并不孤单。Reddit 社区称其为“倒退”,Arena 排行榜显示 4.6 在指令遵循上更胜一筹,但 Anthropic 的官方迁移指南却表示一切按设计预期进行。这种认知偏差源于我们正在用旧世界的地图来探索新大陆。
4.6 会“猜”你的意思,它擅长填补你指令中的空白;而 4.7 停止了猜测,它严格按字面意思执行指令。这意味着,过去那种模糊的指令不再能自动触发完美的泛化结果。本文将基于实战经验,为你梳理如何从 4.6 迁移到 4.7,通过十个关键动作,利用“意图”这一万能钥匙,解锁 4.7 的真实潜力。
图片来源:Paweł Huryn / X
为什么 4.7 看起来像是“倒退”了?
本节欲回答的核心问题是:为什么很多用户认为 4.7 在某些任务上表现不如 4.6,这究竟是真的能力退化还是设计理念的改变?
这并非一次均匀的升级。在编码、创意写作和结构化任务上,4.7 表现卓越;但在模糊指令遵循、多轮对话和长上下文检索方面,它确实表现出了损失。基准测试显示这是一种权衡,而非单纯的衰退。如果你是产品经理(PM),且你的 4.6 工作流依赖于模型“帮你搞清楚你到底想要什么”,那么在 4.7 上,你可能会遇到模型提问更多、执行更少,或者完全按你字面要求执行(结果却不是你真正想要的)的情况。
图片来源:Paweł Huryn / X
Anthropic 的 Claude Code 负责人 Boris Cherny 甚至表示:“我花了几天时间才学会如何有效地使用它。”这证明了 4.7 的心智模型已经发生了根本性的转变。它变得更加具有代理性(Agentic)和精确性,但这需要我们用不同的方式与它对话。
反思 / 学到的教训:
过去我们习惯于把 AI 当成一个能“读心”的超级实习生,我们只需要扔给它一个模糊的想法。现在,我们必须转变观念,把 AI 看作是一个极其严谨、如果不给明确定义就会严格按照字面执行的执行者。这不是它变笨了,而是它变得更“诚实”了。
意图:通用的解锁钥匙
本节欲回答的核心问题是:在 4.7 这种字面执行的新范式下,什么才是驱动模型表现的核心要素?
这就是贯穿全文的原则:4.7 奖励清晰的意图。文章后续的所有战术都是基于这一原则展开的。解决之道不在于写更长的提示词、制定更多的规则或更大的 CLAUDE.md 文件,而在于清晰地表达意图。
意图可以分为两个层面:
-
战略背景: 这是持久化的信息。你在构建什么?为谁构建?什么是不允许的?什么算作好的结果?这些内容只需写一次,放入 CLAUDE.md中。每次会话加载时,它都会以渐进披露的方式出现,这样你就不必在每一轮对话的第一回合都付费重新介绍项目背景。 -
单次任务意图: 这是可变的信息。你现在具体想让 Claude 做什么?你仍然需要每轮对话都写这部分。但得益于 CLAUDE.md,你不再需要在每次任务意图之上重复输入战略背景。
图片来源:Paweł Huryn / X
将 Claude 视为合作伙伴
正如 Andrej Karpathy 所建议的:“大语言模型非常擅长循环执行直到满足特定目标,这正是大多数人感受到‘AGI 魔法’的地方。不要告诉它做什么,给它成功标准,然后看着它执行。”
这意味着你需要从“命令式”转向“声明式”。不要说“写一个函数来获取用户数据”,而应该说“目标是安全且高效地获取用户数据,需符合 GDPR 标准”。
行业趋势的收敛
有趣的是,Anthropic 和 OpenAI 正在从两个相反的方向向中间靠拢。Anthropic 正在让其原本注重“意图”的模型增加精确度;而 OpenAI 在 2025 年 12 月更新的模型规范中则表示要“不仅考虑字面措辞,还要考虑潜在意图”。无论你使用哪个平台,清晰表达意图这一技能正成为跨供应商、跨模型通用且寿命最长的核心能力。
图片来源:Paweł Huryn / X
Anthropic 甚至已经在“托管代理”框架中内置了成功标准和结果导向的机制。这进一步印证了掌握“表达意图”的重要性。
十个 Claude Opus 4.7 迁移实战动作
本节欲回答的核心问题是:具体在操作层面,我应该修改哪些设置、调整哪些提示词策略,才能让我的工作流在 4.7 上流畅运行?
以下是经过 16+ 小时深度测试总结出的十个最高投资回报率(ROI)的迁移动作。
图片来源:Paweł Huryn / X
1. 在 CLAUDE.md 中前置意图
你不需要每次会话都重新输入战略背景。把它写进 CLAUDE.md 一次,未来的每次会话开始时上下文就已经加载好了。你仍然需要每轮对话写单次任务意图,但你停止了支付“记住我们在构建什么”的税金。
你可以将代理不必每次会话都读取的信息委派给其他文件,例如下方的 strategy.md:
图片来源:Paweł Huryn / X
应用场景:
假设你正在构建一个 SaaS 平台。与其每次都告诉 Claude “我们是做 B2B HR 软件的,风格要专业但不死板”,不如在 CLAUDE.md 中写明:“我们正在构建一个面向中型企业的 B2B HR SaaS 平台。目标受众是 HR 经理。语气应专业、简洁且具有同理心。避免使用俚语。” 这样,每次你只需要说 “写一封关于新功能发布的邮件”,模型就能自动调用之前的背景。
2. 默认使用 Extra High (xhigh) 模式
这是一个介于 High 和 Max 之间的新力度等级。Anthropic 官方推荐将其用于编码和代理工作。
图片来源:Paweł Huryn / X
Max 模式容易导致“过度思考”。大多数关于“4.7 感觉变慢”的报告,归根结底都是人们下意识地运行在 Max 模式上。只有在问题真正需要深度推理时才使用 Max。
图片来源:Paweł Huryn / X
操作建议:
在 VS Code 的 Claude 扩展中,将默认设置调整为 Extra high。除非你在解决极其复杂的算法难题,否则不要动用 Max。
3. 在任务中途切换力度级别
力度是按调用次数计算的,而不是按会话计算的。你可以在遇到困难的子问题时切换到 Max,然后在其余部分回落到 High。
实际案例:
当你让 Claude 重构一个大型代码库时,前 90% 的工作可能只是常规的文本替换和逻辑检查,使用 High 或 Extra High 即可。但当遇到一个极其晦涩的并发 Bug 时,你可以明确指示:“请在此处使用 Max 模式深入分析这个死锁问题。” 解决后,后续的测试用例生成阶段再切回 High。这样既节省了成本和时间,又保证了关键环节的质量。
4. 对旧提示词进行回归测试
4.7 引入了新的分词器,输入的 Token 数量可能会增加 1.0 到 1.35 倍。这意味着在你修改任何一行代码之前,你在 4.7 上的工作流成本就已经上升了。
你需要知道的一个抵消因素是:Anthropic 在发布 4.7 的同时也提高了速率限制:
图片来源:Paweł Huryn / X
反思 / 独特见解:
很多人只关注单次调用的价格,却忽略了“每个正确输出 Token 的成本”。如果你的 4.7 因为更精准而减少了返工次数,那么总成本反而可能下降。建议在切换模型之前,针对你的特定产品进行一次全面的测试,权衡 Token 价格上涨与准确性提升之间的得失。
5. 批量提问,停止“滴灌式”追问
如果你有三个问题,请在一条消息中全部问完。
在 4.6 时代,通过 3-4 轮对话来澄清需求是可行的。但在 4.7 上,每一轮对话都会在之前的字面解释之上增加推理开销。对于 4.7 来说,把澄清作为例外情况,而不是标准工作流。
场景对比:
-
旧习惯(4.6): -
User: 写一个 Python 脚本来抓取网页。 -
Claude: 给出一个基础脚本。 -
User: 加上错误处理。 -
Claude: 更新脚本。 -
User: 再加上日志功能。 -
Claude: 再次更新。
-
-
新方法(4.7): -
User: 写一个 Python 脚本来抓取网页。要求包括:完善的异常处理机制(处理超时、404错误)、详细的日志记录(输出到文件并按时间命名),以及使用 BeautifulSoup 库。请一次性完成。
-
第二种方法能让 4.7 展现出最佳性能,避免了中间状态的上下文累积。
6. 展示你想要什么,而不是说不要什么
正面示例胜过负面规则。根据 Anthropic 的建议:
-
“像这样做:”后面跟简短的例子非常有效。 -
“不要这样做:”通常效果不佳,而且还在尝试上浪费了 Token。
如果你的提示词中超过三行包含“不要”、“绝不”之类的词,请把它们反转过来。理想的输出是什么样的?展示两个示例,然后删掉那些规则。
图片来源:Paweł Huryn / X
修改示例:
-
修改前(负面约束): -
不要写很长的段落。不要使用专业术语。不要用被动语态。不要在结尾加表情符号。
-
-
修改后(正面示例): -
请使用简短有力的句子。例如:“The system is down. We are fixing it.”(系统宕机了。我们正在修复。) -
除非必要,避免使用行话。 -
使用主动语态。例如:“We updated the API.”(我们更新了 API。)
-
7. 删除旧的进度脚手架指令
“每 3 次工具调用总结一次。”“继续之前给我一个状态更新。”“解释你的计划,然后执行。”
把这些都删掉。
Opus 4.7 会在长时间的代理追踪中原生地生成高质量的进度更新:
图片来源:Paweł Huryn / X
应用场景:
以前我们可能需要这样提示:“在执行每一步代码修改后,请输出 ‘Step done’ 并等待我的确认。” 在 4.7 中,你可以直接说:“重构这个模块。” 模型会自动在内部生成详细的思维链和进度追踪,并在最终输出或必要的工具调用中体现出来,无需你手动干预其过程汇报机制。
8. 明确要求它分头行动
Opus 4.7 默认生成的子代理更少,每个任务调用的工具也更少。对于并行探索,你现在必须明确要求。
有效的措辞包括:“在同一轮对话中生成子代理来调查 X、Y、Z。” 自主性上升了,但默认的委派下降了。
你也可以在 DISPATCH.md 中添加关于如何生成子代理的单独指令,并在 CLAUDE.md 中引用该文件:
图片来源:Paweł Huryn / X
操作示例:
当你想要分析三个不同的竞品网站时,不要指望模型自动分心去处理。你应该说:“请启动三个独立的子代理,分别分析 A 网站、B 网站和 C 网站的定价策略,然后汇总结果。”
9. 审查计划,而不是差异
这是两个不同的基本要素,不要混淆它们。
-
Plan 模式(在 Claude Code CLI 中按两次 Shift+Tab): 内联模式,在当前会话中存在任何代码之前就展示计划。用于任何涉及多个文件的更改:
图片来源:Paweł Huryn / X
-
/ultraplan(仅限 CLI,在 VS Code 扩展中无效): 基于 CLI 的云端计划起草,在浏览器中审查。计划在远程会话中运行,同时你的终端保持空闲:
图片来源:Paweł Huryn / X
为什么这在 4.7 上更重要?
因为 4.7 会按字面意思理解意图,计划中的一个小误解会导致代码差异中的大误解。审查一个 10 行的计划以发现意图偏离只需要 30 秒,但审查一个 200 行的差异来发现同样的偏离需要 15 分钟。
图片来源:Paweł Huryn / X
意图偏离会复合叠加。在计划阶段就抓住它。如果你发现 4.7 生成的代码不符合预期,通常是因为上一步的计划审查被跳过了。
10. 仅使用自适应思考
固定的思考预算已经消失了。使用 thinking: {type: 'adaptive'} 加上力度参数。旧的带有 budget_tokens 的 API 调用将返回 HTTP 400 错误。
在切换模型标志之前,请务必查找并替换以下代码:
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=16000,
thinking={"type": "adaptive"}, // 注意这里的变化,旧的 budget_tokens 已失效
messages=[
{
"role": "user",
"content": "Explain why the sum of two even numbers is always even.",
}
],
)
如果你不是工程师,你不需要死记语法。只需把这份文档交给你的代理即可(去掉“.md”以获得人类友好的视图)。
图片来源:Unsplash
结语:从“聪明”到“诚实”的进化
本节欲回答的核心问题是:总结而言,4.7 带给我们的根本性改变是什么,我们该如何以此建立长期优势?
4.6 感觉很聪明,而 4.7 是诚实的。表面上看似智力下降的表现,其实是 4.7 拒绝猜测你的潜台词。
你的杠杆在于清晰的意图。而不是审查每一行代码、编写无尽的指令,或者每次会话都重复输入相同的上下文。你将越多的意图和期望推入 CLAUDE.md,你运行它所付出的成本(金钱和注意力)就越少。
这不仅仅是关于提示词的技巧,这是一种新的工作哲学。在这个哲学中,明确的战略背景和精准的成功标准,替代了模糊的指令和不断的纠错。掌握这一点,你就掌握了面对未来所有模型更新的核心竞争力。
实用摘要 / 操作清单
为了帮助你快速落地,以下是针对 Claude Opus 4.7 的核心操作检查清单:
| 分类 | 操作项 | 关键细节/命令 |
|---|---|---|
| 心智模型 | 理解“字面执行” | 4.7 不再猜测,必须指令明确。 |
| 上下文管理 | 配置 CLAUDE.md | 将战略背景(项目目标、受众、禁忌)写入此处,避免重复输入。 |
| 参数设置 | 调整力度级别 | 默认使用 Extra high,仅在深度推理时使用 Max。 |
| 交互习惯 | 批量提问 | 将多个问题合并为一条消息发送,减少多轮对话开销。 |
| 提示词优化 | 正面示例为主 | 少用“不要做 X”,多用“像 Y 这样做”并给出示例。 |
| 工程实践 | API 更新 | 将 budget_tokens 替换为 thinking: {"type": "adaptive"}。 |
| 工作流 | 先审计划后审代码 | 使用 Plan 模式或 /ultraplan 先确认意图,再查看代码 Diff。 |
| 进阶技巧 | 显式分派任务 | 明确要求模型“生成子代理”以处理并行任务。 |
一页速览
如果你只有一分钟,请记住以下核心要点:
-
意图为王: 4.7 奖励清晰。用 CLAUDE.md锁定战略背景,用单次指令明确当前任务。 -
默认设置: 编码和 Agentic 任务请使用 Extra High 模式,别滥用 Max。 -
表达方式: 展示想要的正面示例,而不是列出一堆“禁止事项”。 -
审查流程: 在 Plan 阶段拦截意图错误,别等到 200 行代码写完再 Review。 -
API 变更: 必须使用 adaptive thinking,旧的固定预算调用会报错。
常见问答 (FAQ)
1. 我的提示词在 4.6 上完美运行,在 4.7 上却失败了,最常见的原因是什么?
最常见的原因是提示词依赖模型“猜测”你的意图。4.7 会按字面理解模糊指令。请检查提示词中是否有未明确的假设,并将其转化为明确的约束或示例。
2. Extra High 模式和 Max 模式到底有什么区别?
Max 模式容易导致过度思考,反应变慢且成本极高;Extra High 是 Anthropic 推荐的默认高级模式,平衡了推理深度和响应速度,适用于绝大多数编码和代理任务。
3. 我该如何更新我的 API 代码以适配 4.7?
你需要移除旧的 budget_tokens 参数,并确保代码中使用了 thinking={"type": "adaptive"}。继续使用旧参数将导致 HTTP 400 错误。
4. 为什么 4.7 不像以前那样自动生成进度更新了?
其实 4.7 原生支持高质量的进度更新。你应该删除提示词中要求“每步汇报”或“生成摘要”的冗余指令,让模型按自己的节奏输出,这通常更高效。
5. 在使用 4.7 时,为了降低成本,我应该怎么做?
除了将力度设置在合理的水平外,最重要的是“批量提问”。将原本分散在 3-4 轮对话中的问题合并为一个请求,可以显著减少 Token 消耗和推理开销。
6. Plan 模式和直接生成代码有什么区别?我应该选哪个?
Plan 模式会在写入代码前先列出步骤。对于 4.7 来说,强烈建议对涉及多个文件的任务先使用 Plan 模式。这能让你以极低的成本(30秒)纠正意图偏差,避免在代码层面进行昂贵的修改(15分钟)。
7. 如果我发现 4.7 生成的子任务变少了,是不是出错了?
不是错误,这是设计行为。4.7 默认的自主委派减少了。如果你需要并行处理多个任务(如同时搜索多个资料源),必须明确指令:“请生成子代理分别处理…”。
8. CLAUDE.md 文件真的有那么重要吗?
是的。它将持久化的“战略意图”与临时的“任务意图”分离。配置好它,可以避免你在每次对话中重复输入项目背景,从而大幅节省 Token 和注意力成本。

