大部分人并不知道 AI 一直都有「质量旋钮」
大部分人以为每一个 AI 工具的思考力度都是固定的,像一辆单速单车。在 2026 年 5 月 28 日之前,这个假设大致正确。但就在当日,Anthropic 推出 Claude Opus 4.8,加入一项全新功能:力度调节 (Effort Control)。这是一个四档滑杆,由使用者决定模型在回答前思考得有多深入。它是业界第一个对大众开放的 AI 质量旋钮。
对大多数老板来说最令人意外的事实是:最低档与最高档的差距,不是 10% 或 20%。在复杂推理任务上,根据 Anthropic 公布的基准,差距超过 70%。同一个模型、同一个 prompt、五秒等待对比 45 秒等待,产生的是本质上不同的答案。
本文会逐步拆解力度调节是什么、四档分别有什么作用、何时应该用哪一档,以及香港老板应如何决定每个任务配哪一档。
力度调节是什么?
力度调节是 Claude Opus 4.8 推出的四档设定,让使用者选择模型在输出答案前,要付出多少运算思考。四档分别是:Low (低)、High (默认高)、Extra (特高)、Max (最高)。档位愈高,Claude 投入愈多时间、生成愈多内部推理步骤、并在回答前更彻底地检查自己的工作。
根据 Anthropic 于 2026 年 5 月 28 日发布的文件,力度调节位于 Claude.ai 模型选择器旁边。它是一个可见滑杆,不是隐藏参数。每位使用者可以按对话切换档位,而每一个回答都会显示所选档位。
此功能仅适用于 Claude Opus 4.8。早期模型,包括 Opus 4.6 和 4.7,并未开放此控制。Claude.ai、Claude API 和 Claude Code 三个介面都看到同样四档,但底层的算力预算与收费按介面而异。
力度调节实际上如何运作?
力度调节调整的是 Claude 内部的推理预算。在 Low 档,Claude 产生较少隐藏推理 token,并回传第一个合理答案。在 Max 档,Claude 可以开启多条平行推理路径,逐一对照 prompt 验证,只有当自我检查通过才提交答案。
用一个实用的比喻:想像你问一位资深员工一条问题。在 Low,员工说出脑中第一个冒出的答案。在 High,员工思考 10 秒并检查自己的假设。在 Extra,员工先草拟答案,自己检视一次,修订一次。在 Max,员工草拟、检视、修订、自问「有什么可能会错」,然后才回答你。
Anthropic 公布的 Opus 4.8 基准显示,这不是市场语言。在 SWE-Bench Verified 编程基准上,Max 档在解题率上比 Low 档高超过 70%。在长篇分析任务上,差距较小,但仍然显著。
每一档的作用与适用时机
四档对应不同任务类型。选对档位不是永远选最高,而是让力度配合任务。
Low (低):用在快速查询、简单摘要、单段草稿、以及任何速度比深度更重要的任务。典型回应时间少于五秒。适合:改写一句句子、摘要一封短电邮、生成一段即时 caption。
High (默认高):Anthropic 建议大部分商业工作的默认档。回应时间 8 至 15 秒。适合:起草客户回覆、准备一页简报、撰写产品描述、配合一两个资料来源的常规研究。
Extra (特高):当输出质量真的重要时使用。回应时间约 25 至 45 秒。适合:起草董事会文件、分析合约、建立多步骤计划、比较多个选项的取舍。
Max (最高):保留给最高重要性的工作。回应时间可超过一分钟。适合:撰写具法律敏感性的政策、调试复杂程式错误、推理一份多页策略文件、准备审计回覆。
动态工作流是什么?力度调节的配套功能
动态工作流 (Dynamic Workflows) 是与 Opus 4.8 一同推出的配套功能,让 Claude Code 透过在一次会话中生成大量平行子代理,处理非常庞大的问题。根据 Anthropic 公布,模型可以规划工作、同时运行数百个子代理、逐一验证结果、然后才回报。
对香港企业来说,实际用途是处理以前要工程师才能做的自动化。使用者可以叫 Claude Code 审核 200 封客服电邮中的合规问题、为每一封生成个别回覆草稿、并标示需要人手介入的案例。代理同时处理 200 封,然后综合结果。
动态工作流目前仅限 Claude Code,不适用于消费者版本 Claude.ai。它在较高力度档位运行更久,这也是 Anthropic 把力度调节与动态工作流绑在同一公告的原因。
它要多少钱?为何 Fast Mode 变便宜?
Claude Opus 4.8 的 API 收费未有变动,仍然是 每 100 万输入 token 收 US$5、每 100 万输出 token 收 US$25。价格变动发生在 Fast Mode,即可以将模型运行速度提升至 2.5 倍的模式。
Opus 4.8 的 Fast Mode 现在比上一代便宜三倍,每 100 万输入 token 收 US$10、每 100 万输出 token 收 US$50。对照来看,这是一个有意义的降幅。在过往的 Opus 世代,Fast Mode 为了同样的速度提升,需要支付明显更高的溢价。
在 Claude.ai 内,力度调节不会直接改变订阅费。较高档位在背后消耗更多算力,Anthropic 在现有 Pro 和 Team 计划额度内吸收这部分成本。重度使用 Max 档的用户可能更快碰到速率上限,但每次查询的帐单不会改变。
Opus 4.8 有多诚实?大多数人忽略了这个基准
Anthropic 发布公告中最被低估的数字埋在内文:Opus 4.8 未能向使用者警示重要事件的比例只有 3.7%,在「不加批判地回报有缺陷结果」这项上得 0 分(Claude 史上首次),对比 Opus 4.7 的过度自信则减少超过十倍。
用浅白语言讲:如果 Claude 做了高风险动作或得出有缺陷的推理,现在它更可靠地会告诉使用者。早期世代有时候会用很有信心的语气交出错误答案。Anthropic 的测量显示,Opus 4.8 让程式码层面的缺陷在无人提醒下溜过的机率,比上一代少约四倍。
对于要把 AI 部署在面客或决策支援工作流的企业来说,这个诚实度提升比任何速度提升都重要。它减轻了监督负担。
对力度调节的常见误解
关于力度调节的三个误解已经很常见。任何一个你信错了,都会浪费效率。
误解一:力度愈高愈好。并非如此。在简单任务上,Max 与 High 给出相同的答案,只是 Max 更慢。代价是你的时间,不是帐单。选适合任务的档位。
误解二:力度调节可以取代好的 Prompt。并非如此。写得不好的 prompt 即使用 Max 也只会输出平庸答案。力度调节提升答案的天花板,但 prompt 质量仍然决定地板。
误解三:Low 代表低质量。并非如此。Low 代表较少内部推理。对于常规任务,答案完全足够,速度显著更快。Anthropic 把 Low 定位为高量、简单工作的有效默认,不是退化模式。
香港企业应如何运用力度调节?
给中小企的实用手册:把力度档位对应到团队现有的任务类型。
对于客服与前线工作,默认 Low 或 High。速度比深度重要,大部分回覆都依循范本。每小时数十条回覆是合理节奏。
对于市场营销与内容写作,默认 High,主打作品(例如首页文案或年报段落)切换到 Extra。
对于数据分析与报告,默认 Extra。分析会受益于 Claude 更长的推理,特别是 prompt 要求多重比较或多个情境时。
对于策略性、法律或财务文件,用 Max。当错误代价高,较慢的回应是值得的。
大原则:用最低档位,只要它给出的答案你不需要修改。再高就是浪费时间。
力度调节常见问题
免费版 Claude 有力度调节吗?
没有。截至 2026 年 6 月,力度调节仅开放给 Claude Pro、Team、Enterprise 和 Claude API 使用者。免费版只见到不同模型的默认 High 档。
力度调节支援广东话或繁体中文吗?
支援。设定本身与语言无关。底层推理质量的差异在英文、繁体中文、简体中文和广东话的 prompt 上一致成立。
力度调节与旧版 Claude 的 Extended Thinking 有什么分别?
Opus 4.5 和 4.6 的 Extended Thinking 是一个开关。Opus 4.8 的力度调节是四档滑杆,分级更干净、成本质量校准更好。
力度愈高一定会得到愈好的答案吗?
力度愈高的答案推理更彻底。但对于不会受益于更多推理的任务,High、Extra、Max 的输出可能难以分辨。
给香港老板的结论
力度调节是主流 AI 厂商首次把质量旋钮交到使用者手中,而不是藏在产品分级背后。四档滑杆只是一个小小的介面改变,但它令成本与质量的取舍,第一次变成清晰可控的选项。
对于已经在用 Claude 的香港企业,立即行动是重新训练团队,告诉他们什么时候用哪一档。错误的默认会在 Max 浪费时间,或在 Low 牺牲质量。对于仍在评估 AI 厂商的企业,配备力度调节的 Opus 4.8 是迄今为止最干净的例子:一个 AI 工具尊重使用者对「何时需要深度、何时速度为王」的判断。
懂AI的冷,更懂你的难。UD 同行28年,让科技成为有温度的陪伴。
准备为团队选择合适的 AI 工具?
Claude、ChatGPT、Gemini、Microsoft Copilot,每个厂商都推出略有不同的控制介面。为你的业务选择合适的组合,需要的不只是功能对比。UD 过去 28 年协助香港中小企用对的方式部署 AI 工具。我们手把手教你完成每一步,由比较厂商到训练团队。