Claude 自适应思维（Adaptive Thinking）：大多数人都未用对的 Effort 参数

Anthropic 的自适应思维改写了提示工程的做法。大多数人仍在写 Claude 已不需要的思维链指令。

实用攻略

2026-06-16

自适应思维是大多数人尚未补上的提示升级

Anthropic 在 Claude Sonnet 4.6 与 Claude Opus 4.8 推出了自适应思维（Adaptive Thinking），认真做提示工程的方法因此被改写。你不再需要在提示裡写「请逐步思考」，而是在 API 设定一个叫 effort 的参数，模型会自己决定何时深度思考、何时快速作答。但大多数人仍在写 Claude 已不需要的思维链指令。

自适应思维不是「延伸思考」的改名。延伸思考强制每次请求都进入推理步骤。自适应思维是一个开关：只在这个问题值得时才动用延伸思考。对于代理工作流程、多工具管线与长对话来说，这个差异就是「专注又快速的模型」与「对微不足道讯息浪费大量 token 过度思考的模型」的分别。

本文提供自适应思维的实用心智模型、四个 effort 等级与各自的使用时机，以及你现有提示中应该删掉、因为 Claude 现在比你还聪明的三个指令类别。

Claude 的自适应思维是什么？

自适应思维是 Claude Sonnet 4.6 与 Claude Opus 4.8 的一种模式：模型在每次请求时自行决定是否动用延伸推理，以及推理该走多深。启用方式是在 API 呼叫中设定 thinking.type 为 "adaptive"，再选择 effort 等级。Claude 即时评估提示的复杂度，据此分配思考 token。

这个机制取代了旧版的做法：你指定 budget_tokens，给每次呼叫一个固定的推理预算。Budget tokens 迫使你在模型还没看到提示前就预测任务难度。自适应思维把这个决定权交回模型，而模型现在分配推理的表现，比开发者用猜的还好。根据 Anthropic 文件，自适应思维也会自动启用 interleaved thinking，意即 Claude 可以在代理工作流的工具呼叫之间思考。

实际影响：任何混合任务类型的应用（一个客服代理同时处理「你们的营业时间？」与「处理这张涉及 5 项退款的退款申请」），自适应思维会让模型在简单情况下滑过去，在复杂情况下深入下去，而你不需要把请求路由到不同模型设定。

四个 effort 等级分别在什么情况使用？

自适应思维的 effort 参数有四个值：minimal、low、medium、high。每个值控制 Claude 在输出前探索推理路径的积极程度。Sonnet 4.6 预设为 high。每个等级都有清楚的最佳使用情境，用错等级不是浪费 token 就是牺牲准确度。

minimal 用于速度比深度重要的任务：分类、简单抽取、友善闲聊、固定风格的内容改写。Claude 几乎从不进入延伸思考。延迟最低，token 成本最低。高量第一线客服、简单表单资料抽取、短答 FAQ 回应，用这个等级。

low 是大多数业务任务的校准中位：短报告、需要准确度的摘要、结构化资料转换、基础 SQL 或程式码生成。Claude 遇到棘手部分时才选择性思考。如果你不希望每次请求都触发延伸思考，但又希望输入复杂时模型自动深入，这是大多数内部工具的合理预设。

medium 用于真正困难、预期 Claude 要推理的问题：多步分析、非小型程式库的程式码审查、逻辑错误除错、从原始数据出发的策略建议。Claude 会稳定进入延伸思考。延迟上升，但在延伸思考真正有用的任务类型上，品质差异很明显。

high 是最高推理设定：复杂研究综述、多文件推理、需要在多次工具呼叫间规划的代理工作流、艰深数学、新颖证明。Claude 几乎一定会思考，且通常思考得很深。这是 Sonnet 4.6 的预设，也是任何「答错的代价高于答慢」的任务的正确选择。

如何实际呼叫自适应思维？

自适应思维的 API 呼叫结构很简单。你在请求 body 中加入一个 thinking 物件，type 设为 "adaptive"，并指定 effort 等级。其馀 Claude 自行处理。同一个呼叫在 Anthropic API、Amazon Bedrock 或 Vertex AI 都能用，只有参数命名上的小差异。

马上试试以下提示结构（Anthropic API）：

--- POST https://api.anthropic.com/v1/messages

--- Headers: x-api-key, anthropic-version: 2023-06-01

--- Body (JSON)：

{

--- "model": "claude-sonnet-4-6",

--- "max_tokens": 4096,

--- "thinking": { "type": "adaptive", "effort": "medium" },

--- "messages": [ { "role": "user", "content": "Your prompt here" } ]

}

当 Claude 选择推理时，回应会在最终答案旁附上一个 thinking 内容区块。你可以为了透明度而读它，为了稽核而记录它，或在呈现给终端使用者前把它剥掉。决定权在你。

如果你用 Claude.ai 或 Claude Code：支援的模型已预设开启自适应思维，你不需要做任何设定。同样的动态适用，模型自己决定每一轮要不要深度思考。这也是为什么「帮我摘要这封邮件」感觉很快，而「审查这段 4000 行脚本的竞争条件」则需要较长时间。

哪些提示指令现在应该删掉？

自适应思维让许多人仍在生产环境写的提示鹰架失效。在 Sonnet 4.6 与 Opus 4.8 上，三类指令现在会主动带来反效果。删掉它们会缩短提示、降低 token 成本，往往还会提升输出品质，因为 Claude 不再需要对抗你写的指令与它自己的推理行为。

删掉：「请逐步思考再作答。」Sonnet 4.6 在 effort 为 medium 或 high 时，会自行逐步思考。加上这个指令反而可能把 Claude 推向在简单请求上冗长推理。改用 API 层的 effort 参数。如果你无法设定 API 参数（消费版 Claude.ai），直接省略这个指令即可，预设行为已比提示更聪明。

删掉：「请慢慢来，仔细推理。」同样的问题。Claude 已根据任务校准推理深度。这类软性指令要不被忽略，要不就把模型推向过度思考。改为指定你的输出要求，例如「你的答案必须为每一个提议步骤提供推理依据」。

删掉：「请好好思考使用者真正想要的是 X 还是 Y。」改成结构化的歧义处理指令：「若使用者的意图在 X 与 Y 之间有歧义，在继续之前先问一个釐清问题。」Claude 会用自适应思维评估这个条件，但这个指令告诉它在判断后该做什么，这比要它「更努力思考」有用得多。

如何为你的应用选择正确的 effort 等级？

effort 等级的选择对应一组清楚的应用问题。每个问题会缩窄你的选项。五分钟内你就能为任何新建应用锁定正确等级，再根据实际运作观察调整。以下框架是大多数生产团队在实作中收敛出来的版本。

问题一：你的容错空间有多大？如果答错会以实质方式耗费使用者的时间或金钱（财务计算、法律审查、医疗情境、客户升级逻辑），预设 high effort。如果答错只是恼人但下一轮可以补救（闲聊、基础搜寻、随意内容初稿），minimal 或 low 就够。

问题二：你的延迟预算多少？如果你的使用者盯着聊天视窗等三秒内回应，你不可能每一轮都跑 high effort。自适应思维有帮助，因为 Claude 只在需要时推理，但 high effort 触发时仍会增加延迟。在每个等级实测你的 p95 延迟，挑符合的等级。

问题三：你的输入变异有多大？如果你的应用输入分佈很窄（结构化登记表单、固定范本请求），你可以预测正确的 effort 等级并锁定它。如果输入变化极大（开放式聊天、跨领域 Q&A、通用代理），用 medium 或 high，让自适应思维在难题上自行升档，你不需要事先侦测。

问题四：帐单看起来如何？延伸思考产生更多 token。Token 成本随 effort 上升。对高量应用，分别在 low 与 medium 上跑一个代表性样本，量化品质差异。差异小，low 是理性选择。差异大，多花的成本通常值得。

哪些错误会破坏自适应思维工作流程？

三个错误会稳定地把自适应思维从升级变成倒退。每个一旦你知道往哪看都很容易诊断。避开它们，这项升级就会照设计运作。

错误一：把思维指令与 effort 设定混用。如果你在 API 把 effort 设为 medium，又在提示写「请逐步思考」，Claude 收到双重讯号，可能在无关紧要的情境过度思考。挑一个思考控制通道：用参数，不用提示。设定 effort 时，把提示中的推理指令清乾淨。

错误二：把 budget_tokens 与 adaptive 一起硬编码。两个系统互斥。如果你的程式码仍有 Sonnet 4.5 时期的 budget_tokens 设定，切换到 adaptive 时要移除它。否则请求会失败或产生不一致行为。部署前审查所有模型呼叫的封装层。

错误三：把 effort 当成「越高越好」的品质旋钮。High effort 不是「比较好」。它是「比较多推理」。对不需要推理的任务（格式化、翻译、简单抽取），high effort 反而会因为加入无关的中间步骤而伤害品质。effort 对应任务类型，不对应「请给我你最好的答案」。

结论：推理成为基础设施

自适应思维把 Claude 的推理从「提示层的小技巧」搬到「基础设施层的设定」。你不再用普通语言哄诱模型，而是调整一个它比你还会处理的参数。这是正确方向。接住这次升级的人，会减少在思维链措辞上耗费的时间，把心力放在工作流程中真正需要人类的部分。

懂AI，更懂你 UD相伴，AI不冷。自适应思维是一个例证：AI 工具现在已聪明到工作不再关于聪明提示，而是关于乾淨配置与清晰的产品决策。

想把它整合进团队的工作流程吗？

了解这个参数是一回事。把它接进团队实际的 Claude 工作流程，客服代理、内部工具或内容管线，又是另一回事。UD 的 AI Employee Hub 提供可在数日内部署的 Claude 工作流程范本，我们手把手带你完成每一步，从模型选择、effort 调校到生产上线。

探索 AI Employee Hub

测试你的 AI 知识等级

其他人也看了

Midjourney V8.1 实战：用 HD 模式与 Raw 参数做出可商用的图像 AI与《个人数据条例》：2026香港企业合规框架完整指南什么是情境工程？正在取代提示工程的企业AI新学科什么是 Gemini in Chrome？香港老板的入门指南什么是 ChatGPT 活跃会话？老板的账户安全指南

UD Blog

专业文章及见解，揭示科技领域的一切

Claude 自适应思维（Adaptive Thinking）：大多数人都未用对的 Effort 参数

Anthropic 的自适应思维改写了提示工程的做法。大多数人仍在写 Claude 已不需要的思维链指令。

自适应思维是大多数人尚未补上的提示升级

Claude 的自适应思维是什么？

四个 effort 等级分别在什么情况使用？

如何实际呼叫自适应思维？

哪些提示指令现在应该删掉？

如何为你的应用选择正确的 effort 等级？

哪些错误会破坏自适应思维工作流程？

结论：推理成为基础设施

想把它整合进团队的工作流程吗？

其他人也看了

UD Blockchain 通讯