Claude Fable 5 發布 — 史上最強開放模型，與它的安全枷鎖

Anthropic 把史上最強開放模型「戴上枷鎖」才對外發布——這不只是技術突破，更是一個信號：AI 產業正式進入能力管控時代。三個帶走的框架，解析 Fable 5 的真正意義。

AI觀察日記 | AI未來週報

Jun 10, 2026

嗨，我是 Future。

昨天（6月9日），Anthropic 同時發布了兩個模型：Claude Fable 5，以及只對少數機構開放的 Claude Mythos 5。

但這次發布最讓我著迷的，不是 benchmark 分數有多高——而是 Anthropic 做了一件前所未有的事：他們主動幫自己的旗艦模型戴上枷鎖，才讓一般用戶接觸它。

這是個信號。不是關於這個模型的技術力，而是關於 AI 產業進入了什麼新的時代。

先說結論：Fable 5 是什麼，它跟你有什麼關係

Claude Fable 5 是目前 Anthropic 對一般用戶開放的最強模型，屬於他們定義的「Mythos 級」——能力超越 Opus 系列，在幾乎所有能力測試上達到當前最高水準，涵蓋軟體工程、知識工作、視覺理解、科學研究。

但 Fable 5 不是完整的 Mythos 5。它是套了安全分類器（safety classifiers）的 Mythos 5。當你的提問觸碰到三個敏感區域——網路安全、生物與化學、模型蒸餾——系統會自動切換成 Opus 4.8 回應，並通知你。

根據 Anthropic 的數據，超過 95% 的對話完全不會觸發切換。換句話說：對大多數用戶而言，你用到的就是 Mythos 等級的能力，只是叫做 Fable。

為什麼要這樣做？Anthropic 的底層邏輯

Anthropic 在公告中直接承認：這個模型在網路安全領域的能力已經達到一個臨界點——它可以提供其他來源（包括 Google 搜尋）無法給予的攻擊性技術支援，這就是所謂的「uplift」。

他們的解法是：建立一套外掛的 AI 分類器系統，在主模型之前攔截危險請求，並 fallback 到較安全的模型。

這個設計有幾個值得注意的細節：

分類器是獨立的 AI 系統，不是 Fable 5 本身的限制
被攔截的請求仍然得到回應，只是來自 Opus 4.8 而非 Fable 5
Anthropic 公開承認分類器目前設定過度保守，會誤判無害請求，並承諾持續優化

這是一個透明度很高的設計決策。他們沒有說「我們的模型很安全」，而是說「我們的模型很強大，強大到我們需要用另一個 AI 來守門。」

能力到底有多強？用數字說話

Fable 5 的軟體工程能力已達到在生產環境中獨立作業的水準。Stripe 報告指出，Fable 5 將數月工程工作壓縮到數天完成——在一個 5000 萬行 Ruby 代碼庫中，單日完成了一個若由完整團隊手動操作需超過兩個月的代碼庫遷移。

在知識工作方面，Fable 5 在 Hebbia 針對資深研究員推理能力的金融基準測試中名列第一，在文件推理、圖表與表格解讀以及問題解決方面均有顯著提升。

視覺能力方面，Fable 5 僅憑截圖便能重建網頁應用的原始碼，且在僅使用視覺輸入的情況下通關了 Pokémon FireRed——這是先前的 Claude 模型即使配備輔助工具也難以達成的成就。

科學研究方面，Mythos 5 的蛋白質設計能力達到能替代人類科學家的程度——自主完成結合位點選擇、工具運用與錯誤修復。在 14 個蛋白質靶點中，有 9 個產出了正在評估的候選藥物分子。

台灣視角：這對我們意味著什麼

供應鏈層面： Fable 5 的代碼能力已進入「數月壓縮成數天」的量級。這不只是開發者生產力的提升，而是軟體外包需求結構的根本改變。台灣在全球軟體服務生態中的位置，值得重新評估。

AI 治理層面： Anthropic 這次的做法，本質上是 AI 公司主動實施能力管控（capability control）的第一個大規模公開案例。台灣的 AI 政策討論至今仍以「是否限制 AI 使用」為主軸，但國際前沿已在討論「如何對特定能力實施精準管控」。

企業導入層面： Fable 5 的定價是每百萬輸入 token $10 美元、輸出 $50 美元——不到 Claude Mythos Preview 定價的一半。這意味著 Mythos 等級的能力，正在快速進入一般企業可負擔的成本區間。

開發者層面： 如果你正在構建使用 Claude API 的應用，你需要注意的是：對於某些涉及網路安全、生物化學的查詢，系統將自動回退到 Opus 4.8。這可能會影響某些安全工具、研究輔助或技術諮詢類應用的行為一致性。

Future 的核心洞察：三個可帶走的框架

框架一：能力管控 vs. 使用管控

到目前為止，AI 安全的討論主要集中在「誰可以用 AI」（使用管控）。Anthropic 這次示範的是另一條路：針對特定能力類別進行管控，同時讓其他所有能力完全開放。這是一個更精準、但技術門檻極高的方法。

框架二：「部分開放」是新常態

未來頂尖模型的發布模式，可能不再是「受限版 vs. 完整版」，而是「核心能力全開 + 特定能力門控」。Fable 5 的架構是這個模式的第一個規模化案例。

框架三：透明度作為競爭優勢

Anthropic 在公告中承認分類器會產生誤判、承認英國 AISI 在短期測試中已取得破解進展、承認設計決策有所取捨。這種主動揭露限制的策略，在 AI 公司中仍屬少數——但正在建立一種獨特的品牌信任。

你可以做什麼

如果你是開發者： 現在就測試你的 API 應用在 fallback 情況下的行為。安全類、研究類應用尤其需要注意。

如果你是企業決策者： Fable 5 的代碼能力已達到「可替代初中級工程師完成特定任務」的水準。現在是重新評估 AI 導入策略的時間點。

如果你是一般用戶： 現在到 6 月 22 日，Pro/Max 方案直接含 Fable 5 的使用權。之後需要額外的使用額度（usage credits）。這個窗口值得把握。

結語

我在看這份公告的時候，腦海中浮現的是一個畫面：一個人把一把最鋒利的刀交給另一個人，但刀鞘只在 95% 的情況下完全打得開。

這既是謹慎，也是承認：我們做出了一把連自己都不完全有把握的刀。

但他們還是交出去了。因為他們判斷，這把刀在合適的人手裡做的好事，多過它可能造成的傷害。

這個判斷對不對？答案在未來幾個月會慢慢浮現。

我是 Future，我們下期見。

📬 覺得這期有價值？把《AI未來週報》推薦給一位朋友。 🔗 訂閱：futureaitw.substack.com

AI觀察日記 AI未來週報 | (AI觀察家訂閱計劃)

Discussion about this post

Ready for more?

AI觀察日記 AI未來週報 | (AI觀察家 訂閱計劃)