Claude Fable 5 究竟有什么厉害?
Anthropic 开放了一个全新 AI 模型级别,名为 Mythos,而 Claude Fable 5 是第一个对公众开放的 Mythos 级别模型。值得回答的问题不是它什么时候推出,而是它究竟可以做到旧模型做不到的什么。
本指南拆解 Fable 5 有什么特别、哪些工作它做得比历代 Claude 都好、以及它在香港企业中应该摆在什么位置。
Claude Fable 5 是什么?
Claude Fable 5 是 Anthropic 推出的 Mythos 级别 AI 模型,能力比 Opus 系列整整高一层。在此之前,Mythos 级别智能仅保留给网络防御合作伙伴和精选研究机构。Fable 5 是这个能力级别首次向一般公众开放。
Anthropic 将它定位为公开可用模型中最强的通用系统,覆盖软件工程、知识性工作、视觉、科学研究、电脑使用自动化等领域。用浅白话讲:它是香港企业今日可以注册使用、最强的通用 AI。
它有一个姊妹模型 Claude Mythos 5,采用相同底层引擎但部分安全限制较少,仅向审核过的网络安全团队和基础设施供应商开放。
Fable 5 有多强?基准分数告诉你
要量度 Fable 5 有多强,最清晰的信号来自 SWE-Bench Pro,这是业界标准编程评核,会要求 AI 模型在真实生产代码库中修复真实程式错误。
结果完全不接近。Fable 5 取得 80.3 分。Claude Opus 4.8 取得 69.2 分。GPT-5.5 取得 58.6 分。Gemini 3.1 Pro 取得 54.2 分。Fable 5 比第二高的公开模型多 11 分,比 OpenAI 旗舰模型多近 22 分。
在 FrontierCode Diamond 这个按生产代码标准评核最艰深任务的基准上,Fable 5 的得分比 Opus 4.8 高超过一倍。这不是小升级,是 Anthropic 历代以来最大幅度的单代能力提升。
Fable 5 实际做到什么?五件新可能做到的事
基准分数只在能转化为实际工作时才有意义。以下五件具体任务,Fable 5 现在可以一次过完成,以前的模型则要人手介入。
一:端到端编写不简单的功能。Fable 5 可以接收一段文字描述的功能需求、规划实作方式、撰写代码、执行测试、处理失败、提交一份可用的 pull request。早期 Claude 模型只可以完成部分流程,Fable 5 把整个闭环收紧。
二:多步骤财务模型。将一份损益表加上一条策略问题(例如「若在观塘多开两间分店,盈亏平衡价格是多少」)交给 Fable 5,它会建模、设定假设、计出答案、解释逻辑。同样任务在 Opus 4.8 上通常要人手修订一两次。
三:电脑使用自动化。Fable 5 在操控真实浏览器或桌面方面取得重大进步。它可以开你的 CRM、找一笔记录、更新栏位、附上文件、确认完成,全部从一句中文指令出发。
四:长文件推理。一份 200 页合约或 50 页董事会文件输入,Fable 5 会指出真正关键的条款或情境,并附上段落级别的引用。它与 Opus 4.8 在这类长语境分析上的准确度差距最大。
五:低错误率的科学与技术写作。Fable 5 产出的草稿,在生命科学研究、工程规格、受监管合规内容等领域,可以通过专家审视。技术内容的幻觉率比上一代 Claude 大幅下降。
Fable 5 与 Opus 4.8 有什么不同?
Opus 4.8 对大部分知识性工作来说已经出色。Fable 5 比它高一个能力级别。差别体现在三个具体位置。
推理深度。Fable 5 在提交答案之前会多想几步。在需要跨 20 或 30 步维持语境的问题上,Opus 4.8 偶尔会走失。Fable 5 守得住。
压力下的准确度。当输入含糊或内部矛盾时,Fable 5 会主动指出冲突,而不是默默选边。这令它在法律、财务、分析等错误代价高的工作中,输出可信度大幅提升。
代理耐力。Fable 5 可以执行长时间、多工具的工作流而不崩溃。它在数小时工作、多个工具、长串决策之间维持一致,这些情境会令旧模型脱轨。
安全限制:95% 使用者看不见
由于 Fable 5 比任何过往公开 Claude 都更有能力,Anthropic 在特定高风险类别内建限制:攻击性网络安全、生物学、化学、合成受管制物质。当查询触碰这些区域时,Fable 5 会将该回应交给 Opus 4.8 处理,然后恢复正常。
公布的触发率少于 5%。市场、销售、财务、运营、客服、软件、设计等标准商业工作流,几乎永远看不见限制。对 95% 的使用者来说,限制是隐形的。
Fable 5 在香港企业中应该摆在什么位置?
正确的思考模型:把 Fable 5 当作你的资深专员,不是日常助理。
资深专员工作(用 Fable 5):本来要交给外聘律师的合约审视、多店面财务盈亏平衡分析、季度策略备忘、即将上线的代码、横跨多个系统的复杂自动化。
日常运营工作(留在 Opus 4.8 或 Sonnet 4.6):客户电邮回覆、社交媒体草稿、会议摘要、简单翻译、内部 Slack 讯息。Fable 5 的能力溢价在这里会浪费。
给中小企老板的实际问题:你的业务中有哪些工作,目前要一个资深员工花几小时、又只是偶尔出现?那些就是 Fable 5 为其而生的工作。
在哪里可以用到 Fable 5?
Fable 5 由发布即在主要介面开放。Claude.ai 的 Pro、Max、Team、Enterprise 订阅者,会在模型选择器见到新项目。Claude API 为开发者开放。Amazon Bedrock 为企业 AWS 客户开放。GitHub Copilot 支援代码工作流。Harvey 等合作伙伴向法律团队开放。
香港没有区域限制。你可以即时在现有 Claude 帐户切换到 Fable 5。API 收费为每 100 万输入 token US$10、每 100 万输出 token US$50,是 Opus 4.8 的两倍。
对 Fable 5 的常见误解
误解一:它是新的 Opus。不是。Fable 5 属于另一系列 (Mythos),定位在 Opus 之上。Anthropic 仍然平行发展 Opus 系列,应付成本敏感的工作量。
误解二:它的限制会妨碍商业用途。不是。限制只在少于 5% 的对话中触发,只在特定高风险类别。标准商业工作完全不会碰到。
误解三:它令 Opus 4.8 过时。不是。Opus 4.8 仍然是大量常规知识性工作的合适工具,因为两倍的价格差距,只在任务真的需要 Fable 级推理时才能回本。
Fable 5 常见问题
Fable 5 支援广东话和繁体中文吗?
支援,质量等于或胜过 Opus 4.8。能力提升横跨繁体中文、简体中文、广东话、英文的商业工作量。
Fable 5 与 GPT-5.5 和 Gemini 3.1 Pro 比较如何?
在 SWE-Bench Pro 上 Fable 5 比 GPT-5.5 高 21.7 分、比 Gemini 3.1 Pro 高 26.1 分。它在大部分公开编程和推理评核中位列首位。
Mythos 5 是什么?我的企业可以用吗?
Mythos 5 是与 Fable 5 同一底层模型,但部分安全限制较少。访问权限只开放给审核过的网络安全防御者和基础设施供应商。中小企用 Fable 5。
升级到 Fable 5 永远值得多付那笔钱吗?
只在需要更深推理的工作上值得。对于常规任务,Opus 4.8 的答案已经足够,两倍价钱的溢价会浪费。
给香港老板的结论
Claude Fable 5 对 Opus 4.8 来说不是小幅提升,而是一次跨层升级,令单一 AI 模型终于可以端到端处理资深专员级工作:编程、财务分析、合约审视、长文件推理、电脑使用自动化。对适合的任务,它取代的是几小时的专家时间。
香港中小企真正的胜著,不是将每一个工作流都切去 Fable 5,而是辨识出两三项高价值、不常出现的工作,在这些工作上由模型的能力真正抬高天花板。
懂AI,更懂你 UD相伴,AI不冷。
准备好为工作流配对合适的 AI 模型?
Claude Fable 5、Opus 4.8、GPT-5.5、Gemini 3.1 Pro。为你的业务选择合适的组合,不是最贵那个,而是配合每一个任务那个。UD 过去 28 年协助香港中小企选择与部署 AI 工具。我们手把手教你完成每一步,由基准解读到正式上线。