Claude Fable 5 發布 — 史上最強開放模型,與它的安全枷鎖
Anthropic 把史上最強開放模型「戴上枷鎖」才對外發布——這不只是技術突破,更是一個信號:AI 產業正式進入能力管控時代。三個帶走的框架,解析 Fable 5 的真正意義。
嗨,我是 Future。
昨天(6月9日),Anthropic 同時發布了兩個模型:Claude Fable 5,以及只對少數機構開放的 Claude Mythos 5。
但這次發布最讓我著迷的,不是 benchmark 分數有多高——而是 Anthropic 做了一件前所未有的事:他們主動幫自己的旗艦模型戴上枷鎖,才讓一般用戶接觸它。
這是個信號。不是關於這個模型的技術力,而是關於 AI 產業進入了什麼新的時代。
先說結論:Fable 5 是什麼,它跟你有什麼關係
Claude Fable 5 是目前 Anthropic 對一般用戶開放的最強模型,屬於他們定義的「Mythos 級」——能力超越 Opus 系列,在幾乎所有能力測試上達到當前最高水準,涵蓋軟體工程、知識工作、視覺理解、科學研究。
但 Fable 5 不是完整的 Mythos 5。它是套了安全分類器(safety classifiers)的 Mythos 5。當你的提問觸碰到三個敏感區域——網路安全、生物與化學、模型蒸餾——系統會自動切換成 Opus 4.8 回應,並通知你。
根據 Anthropic 的數據,超過 95% 的對話完全不會觸發切換。換句話說:對大多數用戶而言,你用到的就是 Mythos 等級的能力,只是叫做 Fable。
為什麼要這樣做?Anthropic 的底層邏輯
Anthropic 在公告中直接承認:這個模型在網路安全領域的能力已經達到一個臨界點——它可以提供其他來源(包括 Google 搜尋)無法給予的攻擊性技術支援,這就是所謂的「uplift」。
他們的解法是:建立一套外掛的 AI 分類器系統,在主模型之前攔截危險請求,並 fallback 到較安全的模型。
這個設計有幾個值得注意的細節:
分類器是獨立的 AI 系統,不是 Fable 5 本身的限制
被攔截的請求仍然得到回應,只是來自 Opus 4.8 而非 Fable 5
Anthropic 公開承認分類器目前設定過度保守,會誤判無害請求,並承諾持續優化
這是一個透明度很高的設計決策。他們沒有說「我們的模型很安全」,而是說「我們的模型很強大,強大到我們需要用另一個 AI 來守門。」
能力到底有多強?用數字說話
Fable 5 的軟體工程能力已達到在生產環境中獨立作業的水準。Stripe 報告指出,Fable 5 將數月工程工作壓縮到數天完成——在一個 5000 萬行 Ruby 代碼庫中,單日完成了一個若由完整團隊手動操作需超過兩個月的代碼庫遷移。
在知識工作方面,Fable 5 在 Hebbia 針對資深研究員推理能力的金融基準測試中名列第一,在文件推理、圖表與表格解讀以及問題解決方面均有顯著提升。
視覺能力方面,Fable 5 僅憑截圖便能重建網頁應用的原始碼,且在僅使用視覺輸入的情況下通關了 Pokémon FireRed——這是先前的 Claude 模型即使配備輔助工具也難以達成的成就。
科學研究方面,Mythos 5 的蛋白質設計能力達到能替代人類科學家的程度——自主完成結合位點選擇、工具運用與錯誤修復。在 14 個蛋白質靶點中,有 9 個產出了正在評估的候選藥物分子。
台灣視角:這對我們意味著什麼
供應鏈層面: Fable 5 的代碼能力已進入「數月壓縮成數天」的量級。這不只是開發者生產力的提升,而是軟體外包需求結構的根本改變。台灣在全球軟體服務生態中的位置,值得重新評估。
AI 治理層面: Anthropic 這次的做法,本質上是 AI 公司主動實施能力管控(capability control)的第一個大規模公開案例。台灣的 AI 政策討論至今仍以「是否限制 AI 使用」為主軸,但國際前沿已在討論「如何對特定能力實施精準管控」。
企業導入層面: Fable 5 的定價是每百萬輸入 token $10 美元、輸出 $50 美元——不到 Claude Mythos Preview 定價的一半。這意味著 Mythos 等級的能力,正在快速進入一般企業可負擔的成本區間。
開發者層面: 如果你正在構建使用 Claude API 的應用,你需要注意的是:對於某些涉及網路安全、生物化學的查詢,系統將自動回退到 Opus 4.8。這可能會影響某些安全工具、研究輔助或技術諮詢類應用的行為一致性。
Future 的核心洞察:三個可帶走的框架
框架一:能力管控 vs. 使用管控
到目前為止,AI 安全的討論主要集中在「誰可以用 AI」(使用管控)。Anthropic 這次示範的是另一條路:針對特定能力類別進行管控,同時讓其他所有能力完全開放。這是一個更精準、但技術門檻極高的方法。
框架二:「部分開放」是新常態
未來頂尖模型的發布模式,可能不再是「受限版 vs. 完整版」,而是「核心能力全開 + 特定能力門控」。Fable 5 的架構是這個模式的第一個規模化案例。
框架三:透明度作為競爭優勢
Anthropic 在公告中承認分類器會產生誤判、承認英國 AISI 在短期測試中已取得破解進展、承認設計決策有所取捨。這種主動揭露限制的策略,在 AI 公司中仍屬少數——但正在建立一種獨特的品牌信任。
你可以做什麼
如果你是開發者: 現在就測試你的 API 應用在 fallback 情況下的行為。安全類、研究類應用尤其需要注意。
如果你是企業決策者: Fable 5 的代碼能力已達到「可替代初中級工程師完成特定任務」的水準。現在是重新評估 AI 導入策略的時間點。
如果你是一般用戶: 現在到 6 月 22 日,Pro/Max 方案直接含 Fable 5 的使用權。之後需要額外的使用額度(usage credits)。這個窗口值得把握。
結語
我在看這份公告的時候,腦海中浮現的是一個畫面:一個人把一把最鋒利的刀交給另一個人,但刀鞘只在 95% 的情況下完全打得開。
這既是謹慎,也是承認:我們做出了一把連自己都不完全有把握的刀。
但他們還是交出去了。因為他們判斷,這把刀在合適的人手裡做的好事,多過它可能造成的傷害。
這個判斷對不對?答案在未來幾個月會慢慢浮現。
我是 Future,我們下期見。
📬 覺得這期有價值?把《AI未來週報》推薦給一位朋友。 🔗 訂閱:futureaitw.substack.com



