自适应思维是大多数人尚未补上的提示升级
Anthropic 在 Claude Sonnet 4.6 与 Claude Opus 4.8 推出了自适应思维(Adaptive Thinking),认真做提示工程的方法因此被改写。你不再需要在提示裡写「请逐步思考」,而是在 API 设定一个叫 effort 的参数,模型会自己决定何时深度思考、何时快速作答。但大多数人仍在写 Claude 已不需要的思维链指令。
自适应思维不是「延伸思考」的改名。延伸思考强制每次请求都进入推理步骤。自适应思维是一个开关:只在这个问题值得时才动用延伸思考。对于代理工作流程、多工具管线与长对话来说,这个差异就是「专注又快速的模型」与「对微不足道讯息浪费大量 token 过度思考的模型」的分别。
本文提供自适应思维的实用心智模型、四个 effort 等级与各自的使用时机,以及你现有提示中应该删掉、因为 Claude 现在比你还聪明的三个指令类别。
Claude 的自适应思维是什么?
自适应思维是 Claude Sonnet 4.6 与 Claude Opus 4.8 的一种模式:模型在每次请求时自行决定是否动用延伸推理,以及推理该走多深。启用方式是在 API 呼叫中设定 thinking.type 为 "adaptive",再选择 effort 等级。Claude 即时评估提示的复杂度,据此分配思考 token。
这个机制取代了旧版的做法:你指定 budget_tokens,给每次呼叫一个固定的推理预算。Budget tokens 迫使你在模型还没看到提示前就预测任务难度。自适应思维把这个决定权交回模型,而模型现在分配推理的表现,比开发者用猜的还好。根据 Anthropic 文件,自适应思维也会自动启用 interleaved thinking,意即 Claude 可以在代理工作流的工具呼叫之间思考。
实际影响:任何混合任务类型的应用(一个客服代理同时处理「你们的营业时间?」与「处理这张涉及 5 项退款的退款申请」),自适应思维会让模型在简单情况下滑过去,在复杂情况下深入下去,而你不需要把请求路由到不同模型设定。
四个 effort 等级分别在什么情况使用?
自适应思维的 effort 参数有四个值:minimal、low、medium、high。每个值控制 Claude 在输出前探索推理路径的积极程度。Sonnet 4.6 预设为 high。每个等级都有清楚的最佳使用情境,用错等级不是浪费 token 就是牺牲准确度。
minimal 用于速度比深度重要的任务:分类、简单抽取、友善闲聊、固定风格的内容改写。Claude 几乎从不进入延伸思考。延迟最低,token 成本最低。高量第一线客服、简单表单资料抽取、短答 FAQ 回应,用这个等级。
low 是大多数业务任务的校准中位:短报告、需要准确度的摘要、结构化资料转换、基础 SQL 或程式码生成。Claude 遇到棘手部分时才选择性思考。如果你不希望每次请求都触发延伸思考,但又希望输入复杂时模型自动深入,这是大多数内部工具的合理预设。
medium 用于真正困难、预期 Claude 要推理的问题:多步分析、非小型程式库的程式码审查、逻辑错误除错、从原始数据出发的策略建议。Claude 会稳定进入延伸思考。延迟上升,但在延伸思考真正有用的任务类型上,品质差异很明显。
high 是最高推理设定:复杂研究综述、多文件推理、需要在多次工具呼叫间规划的代理工作流、艰深数学、新颖证明。Claude 几乎一定会思考,且通常思考得很深。这是 Sonnet 4.6 的预设,也是任何「答错的代价高于答慢」的任务的正确选择。
如何实际呼叫自适应思维?
自适应思维的 API 呼叫结构很简单。你在请求 body 中加入一个 thinking 物件,type 设为 "adaptive",并指定 effort 等级。其馀 Claude 自行处理。同一个呼叫在 Anthropic API、Amazon Bedrock 或 Vertex AI 都能用,只有参数命名上的小差异。
马上试试以下提示结构(Anthropic API):
--- POST https://api.anthropic.com/v1/messages
--- Headers: x-api-key, anthropic-version: 2023-06-01
--- Body (JSON):
{
--- "model": "claude-sonnet-4-6",
--- "max_tokens": 4096,
--- "thinking": { "type": "adaptive", "effort": "medium" },
--- "messages": [ { "role": "user", "content": "Your prompt here" } ]
}
当 Claude 选择推理时,回应会在最终答案旁附上一个 thinking 内容区块。你可以为了透明度而读它,为了稽核而记录它,或在呈现给终端使用者前把它剥掉。决定权在你。
如果你用 Claude.ai 或 Claude Code:支援的模型已预设开启自适应思维,你不需要做任何设定。同样的动态适用,模型自己决定每一轮要不要深度思考。这也是为什么「帮我摘要这封邮件」感觉很快,而「审查这段 4000 行脚本的竞争条件」则需要较长时间。
哪些提示指令现在应该删掉?
自适应思维让许多人仍在生产环境写的提示鹰架失效。在 Sonnet 4.6 与 Opus 4.8 上,三类指令现在会主动带来反效果。删掉它们会缩短提示、降低 token 成本,往往还会提升输出品质,因为 Claude 不再需要对抗你写的指令与它自己的推理行为。
删掉:「请逐步思考再作答。」Sonnet 4.6 在 effort 为 medium 或 high 时,会自行逐步思考。加上这个指令反而可能把 Claude 推向在简单请求上冗长推理。改用 API 层的 effort 参数。如果你无法设定 API 参数(消费版 Claude.ai),直接省略这个指令即可,预设行为已比提示更聪明。
删掉:「请慢慢来,仔细推理。」同样的问题。Claude 已根据任务校准推理深度。这类软性指令要不被忽略,要不就把模型推向过度思考。改为指定你的输出要求,例如「你的答案必须为每一个提议步骤提供推理依据」。
删掉:「请好好思考使用者真正想要的是 X 还是 Y。」改成结构化的歧义处理指令:「若使用者的意图在 X 与 Y 之间有歧义,在继续之前先问一个釐清问题。」Claude 会用自适应思维评估这个条件,但这个指令告诉它在判断后该做什么,这比要它「更努力思考」有用得多。
如何为你的应用选择正确的 effort 等级?
effort 等级的选择对应一组清楚的应用问题。每个问题会缩窄你的选项。五分钟内你就能为任何新建应用锁定正确等级,再根据实际运作观察调整。以下框架是大多数生产团队在实作中收敛出来的版本。
问题一:你的容错空间有多大?如果答错会以实质方式耗费使用者的时间或金钱(财务计算、法律审查、医疗情境、客户升级逻辑),预设 high effort。如果答错只是恼人但下一轮可以补救(闲聊、基础搜寻、随意内容初稿),minimal 或 low 就够。
问题二:你的延迟预算多少?如果你的使用者盯着聊天视窗等三秒内回应,你不可能每一轮都跑 high effort。自适应思维有帮助,因为 Claude 只在需要时推理,但 high effort 触发时仍会增加延迟。在每个等级实测你的 p95 延迟,挑符合的等级。
问题三:你的输入变异有多大?如果你的应用输入分佈很窄(结构化登记表单、固定范本请求),你可以预测正确的 effort 等级并锁定它。如果输入变化极大(开放式聊天、跨领域 Q&A、通用代理),用 medium 或 high,让自适应思维在难题上自行升档,你不需要事先侦测。
问题四:帐单看起来如何?延伸思考产生更多 token。Token 成本随 effort 上升。对高量应用,分别在 low 与 medium 上跑一个代表性样本,量化品质差异。差异小,low 是理性选择。差异大,多花的成本通常值得。
哪些错误会破坏自适应思维工作流程?
三个错误会稳定地把自适应思维从升级变成倒退。每个一旦你知道往哪看都很容易诊断。避开它们,这项升级就会照设计运作。
错误一:把思维指令与 effort 设定混用。如果你在 API 把 effort 设为 medium,又在提示写「请逐步思考」,Claude 收到双重讯号,可能在无关紧要的情境过度思考。挑一个思考控制通道:用参数,不用提示。设定 effort 时,把提示中的推理指令清乾淨。
错误二:把 budget_tokens 与 adaptive 一起硬编码。两个系统互斥。如果你的程式码仍有 Sonnet 4.5 时期的 budget_tokens 设定,切换到 adaptive 时要移除它。否则请求会失败或产生不一致行为。部署前审查所有模型呼叫的封装层。
错误三:把 effort 当成「越高越好」的品质旋钮。High effort 不是「比较好」。它是「比较多推理」。对不需要推理的任务(格式化、翻译、简单抽取),high effort 反而会因为加入无关的中间步骤而伤害品质。effort 对应任务类型,不对应「请给我你最好的答案」。
结论:推理成为基础设施
自适应思维把 Claude 的推理从「提示层的小技巧」搬到「基础设施层的设定」。你不再用普通语言哄诱模型,而是调整一个它比你还会处理的参数。这是正确方向。接住这次升级的人,会减少在思维链措辞上耗费的时间,把心力放在工作流程中真正需要人类的部分。
懂AI,更懂你 UD相伴,AI不冷。自适应思维是一个例证:AI 工具现在已聪明到工作不再关于聪明提示,而是关于乾淨配置与清晰的产品决策。
想把它整合进团队的工作流程吗?
了解这个参数是一回事。把它接进团队实际的 Claude 工作流程,客服代理、内部工具或内容管线,又是另一回事。UD 的 AI Employee Hub 提供可在数日内部署的 Claude 工作流程范本,我们手把手带你完成每一步,从模型选择、effort 调校到生产上线。