Claude Fable 5 究竟有什麼厲害?
Anthropic 開放了一個全新 AI 模型等級,名為 Mythos,而 Claude Fable 5 是第一個對公眾開放的 Mythos 級別模型。值得回答的問題不是它什麼時候推出,而是它究竟可以做到舊模型做不到的什麼。
本指南拆解 Fable 5 有什麼特別、哪些工作它做得比歷代 Claude 都好、以及它在香港企業中應該擺在什麼位置。
Claude Fable 5 是什麼?
Claude Fable 5 是 Anthropic 推出的 Mythos 級別 AI 模型,能力比 Opus 系列整整高一層。在此之前,Mythos 級別智能僅保留給網絡防禦合作夥伴和精選研究機構。Fable 5 是這個能力等級首次向一般公眾開放。
Anthropic 將它定位為公開可用模型中最強的通用系統,覆蓋軟件工程、知識性工作、視覺、科學研究、電腦使用自動化等領域。用淺白話講:它是香港企業今日可以註冊使用、最強的通用 AI。
它有一個姊妹模型 Claude Mythos 5,採用相同底層引擎但部分安全限制較少,僅向審核過的網絡安全團隊和基礎設施供應商開放。
Fable 5 有多強?基準分數話你知
要量度 Fable 5 有多強,最清晰的訊號來自 SWE-Bench Pro,這是業界標準編程評核,會要求 AI 模型在真實生產代碼庫中修復真實程式錯誤。
結果完全不接近。Fable 5 取得 80.3 分。Claude Opus 4.8 取得 69.2 分。GPT-5.5 取得 58.6 分。Gemini 3.1 Pro 取得 54.2 分。Fable 5 比第二高的公開模型多 11 分,比 OpenAI 旗艦模型多近 22 分。
在 FrontierCode Diamond 這個按生產代碼標準評核最艱深任務的基準上,Fable 5 的得分比 Opus 4.8 高超過一倍。這不是小升級,是 Anthropic 歷代以來最大幅度的單代能力提升。
Fable 5 實際做到什麼?五件新可能做到的事
基準分數只在能轉化為實際工作時才有意義。以下五件具體任務,Fable 5 現在可以一次過完成,以前的模型則要人手介入。
一:端到端編寫不簡單的功能。Fable 5 可以接收一段文字描述的功能需求、規劃實作方式、撰寫代碼、執行測試、處理失敗、提交一份可用的 pull request。早期 Claude 模型只可以完成部分流程,Fable 5 把整個閉環收緊。
二:多步驟財務模型。將一份損益表加上一條策略問題(例如「若在觀塘多開兩間分店,盈虧平衡價格是多少」)交給 Fable 5,它會建模、設定假設、計出答案、解釋邏輯。同樣任務在 Opus 4.8 上通常要人手修訂一兩次。
三:電腦使用自動化。Fable 5 在操控真實瀏覽器或桌面方面取得重大進步。它可以開你的 CRM、找一筆紀錄、更新欄位、附上文件、確認完成,全部從一句中文指令出發。
四:長文件推理。一份 200 頁合約或 50 頁董事會文件輸入,Fable 5 會指出真正關鍵的條款或情境,並附上段落層級的引用。它與 Opus 4.8 在這類長語境分析上的準確度差距最大。
五:低錯誤率的科學與技術寫作。Fable 5 產出的草稿,在生命科學研究、工程規格、受監管合規內容等領域,可以通過專家審視。技術內容的幻覺率比上一代 Claude 大幅下降。
Fable 5 與 Opus 4.8 有什麼不同?
Opus 4.8 對大部分知識性工作來說已經出色。Fable 5 比它高一個能力等級。差別體現在三個具體位置。
推理深度。Fable 5 在提交答案之前會多想幾步。在需要跨 20 或 30 步維持語境的問題上,Opus 4.8 偶爾會走失。Fable 5 守得住。
壓力下的準確度。當輸入含糊或內部矛盾時,Fable 5 會主動指出衝突,而不是默默選邊。這令它在法律、財務、分析等錯誤代價高的工作中,輸出可信度大幅提升。
代理耐力。Fable 5 可以執行長時間、多工具的工作流而不崩潰。它在數小時工作、多個工具、長串決策之間維持一致,這些情境會令舊模型脫軌。
安全限制:95% 使用者看不見
由於 Fable 5 比任何過往公開 Claude 都更有能力,Anthropic 在特定高風險類別內建限制:攻擊性網絡安全、生物學、化學、合成受管制物質。當查詢觸碰這些區域時,Fable 5 會將該回應交給 Opus 4.8 處理,然後恢復正常。
公布的觸發率少於 5%。市場、銷售、財務、營運、客服、軟件、設計等標準商業工作流,幾乎永遠看不見限制。對 95% 的使用者來說,限制是隱形的。
Fable 5 在香港企業中應該擺在什麼位置?
正確的思考模型:把 Fable 5 當作你的資深專員,不是日常助理。
資深專員工作(用 Fable 5):本來要交給外聘律師的合約審視、多店面財務盈虧平衡分析、季度策略備忘、即將上線的代碼、橫跨多個系統的複雜自動化。
日常營運工作(留在 Opus 4.8 或 Sonnet 4.6):客戶電郵回覆、社交媒體草稿、會議摘要、簡單翻譯、內部 Slack 訊息。Fable 5 的能力溢價在這裡會浪費。
給中小企老闆的實際問題:你的業務中有哪些工作,目前要一個資深員工花幾小時、又只是偶爾出現?那些就是 Fable 5 為其而生的工作。
在哪裡可以用到 Fable 5?
Fable 5 由發佈即在主要介面開放。Claude.ai 的 Pro、Max、Team、Enterprise 訂閱者,會在模型選擇器見到新項目。Claude API 為開發者開放。Amazon Bedrock 為企業 AWS 客戶開放。GitHub Copilot 支援代碼工作流。Harvey 等合作夥伴向法律團隊開放。
香港沒有區域限制。你可以即時在現有 Claude 帳戶切換到 Fable 5。API 收費為每 100 萬輸入 token US$10、每 100 萬輸出 token US$50,是 Opus 4.8 的兩倍。
對 Fable 5 的常見誤解
誤解一:它是新的 Opus。不是。Fable 5 屬於另一系列 (Mythos),定位在 Opus 之上。Anthropic 仍然平行發展 Opus 系列,應付成本敏感的工作量。
誤解二:它的限制會妨礙商業用途。不是。限制只在少於 5% 的對話中觸發,只在特定高風險類別。標準商業工作完全不會碰到。
誤解三:它令 Opus 4.8 過時。不是。Opus 4.8 仍然是大量常規知識性工作的合適工具,因為兩倍的價格差距,只在任務真的需要 Fable 級推理時才能回本。
Fable 5 常見問題
Fable 5 支援廣東話和繁體中文嗎?
支援,品質等於或勝過 Opus 4.8。能力提升橫跨繁體中文、簡體中文、廣東話、英文的商業工作量。
Fable 5 與 GPT-5.5 和 Gemini 3.1 Pro 比較如何?
在 SWE-Bench Pro 上 Fable 5 比 GPT-5.5 高 21.7 分、比 Gemini 3.1 Pro 高 26.1 分。它在大部分公開編程和推理評核中位列首位。
Mythos 5 是什麼?我的企業可以用嗎?
Mythos 5 是與 Fable 5 同一底層模型,但部分安全限制較少。存取權限只開放給審核過的網絡安全防禦者和基礎設施供應商。中小企用 Fable 5。
升級到 Fable 5 永遠值得多付那筆錢嗎?
只在需要更深推理的工作上值得。對於常規任務,Opus 4.8 的答案已經足夠,兩倍價錢的溢價會浪費。
給香港老闆的結論
Claude Fable 5 對 Opus 4.8 來說不是小幅提升,而是一次跨層升級,令單一 AI 模型終於可以端到端處理資深專員級工作:編程、財務分析、合約審視、長文件推理、電腦使用自動化。對適合的任務,它取代的是幾小時的專家時間。
香港中小企真正的勝著,不是將每一個工作流都切去 Fable 5,而是辨識出兩三項高價值、不常出現的工作,在這些工作上由模型的能力真正抬高天花板。
懂AI,更懂你 UD相伴,AI不冷。
準備好為工作流配對合適的 AI 模型?
Claude Fable 5、Opus 4.8、GPT-5.5、Gemini 3.1 Pro。為你的業務揀選合適的組合,不是最貴那個,而是配合每一個任務那個。UD 過去 28 年協助香港中小企選擇與部署 AI 工具。我們手把手教你完成每一步,由基準解讀到正式上線。