Claude Fable 5四日驚魂

從萬眾期待的「AI 封神時刻」，到美國政府一紙禁令強制下線 —— 這個名字中有 5 的模型，沒活過 5 天。

讓我們先停下來，感受一下這件事的荒誕程度。

2026 年 6 月 9 日，Anthropic 將它最強大的模型 Claude Fable 5 對外正式發布。那一天，開發者社群沸騰了，評測帖子在 𝕏 上洗版，有人說它「碾壓一切」，有人說它「改寫了 AI 的上限」。Anthropic 的 Mythos 系列，這個此前只對五六家機構開放的神秘模型家族，終於向普通公眾打開了一道門縫。

然後，四天後，這扇門被人從外面焊死了。

6 月 12 日，美國商務部長霍華德・盧特尼克（Howard Lutnick）向 Anthropic CEO Dario Amodei 寄出一封信：以「國家安全」為由，禁止 Fable 5 和 Mythos 5 向任何外國公民開放存取 —— 無論這些人身處美國境內還是境外，甚至包括 Anthropic 內部的外籍員工。Anthropic 當晚收到指令的時間，是美東時間下午 5 點 21 分。

到晚上，Fable 5 在全球範圍內下線。

四天。96 個小時。一場從高光到猝死的極速墜落。

第一天：神話降臨

Fable 這個詞來自拉丁語 fabula，意為「被講述的故事」，與希臘語 mythos 同根。Anthropic 在命名上頗費心思：Mythos 系列是為少數精英保留的神話，Fable 則是普羅大眾可以聽到的那個故事。

6 月 9 日，Anthropic 發布了 Claude Fable 5，這是其 Mythos 模型的首個公開版本，該公司稱其在軟體工程、知識工作和視覺方面表現卓越，但附帶嚴格的安全限制。與此同時，Anthropic 還發布了一款雙胞胎產品：Claude Mythos 5—— 與 Fable 5 使用相同底層模型，但移除了網路安全領域的安全過濾層，僅供經過審查的網路防禦者和關鍵基礎設施營運商使用。Anthropic 稱 Mythos 5 是全球最強的網路安全模型。

通俗地理解：Mythos 5 是上了槍彈的武器，Fable 5 是同款槍，但出廠自帶保險。

就 API 定價而言，Fable 5 的能力在 Anthropic 公開發布的模型中首屈一指，價格約為 Claude Mythos Preview 的一半以下。在訂閱方案上，透過 6 月 22 日，Fable 5 將在 Pro、Max、Team 和 Enterprise 等付費套餐中免費提供。

科技圈的讚美潮水般湧來。沃頓商學院副教授 Ethan Mollick 在部落格寫道，Fable 5「在我用過的所有公開模型中，以相當大的差距超越了其他所有模型」。前 OpenAI 共同創辦人、特斯拉 AI 總監 Andrej Karpathy（他上個月剛宣布加入 Anthropic）在 𝕏 上稱 Fable 5 是一次「超級令人興奮的發布」，是「值得大版本號升級的跨越式進步」。

這一天，Anthropic 的 Mythos 神話，似乎真的成真了。

第二天：「秘密降智」事件爆發

好景不長。發布僅 24 小時後，一場風暴在 AI 社群悄然醞釀。

起因，是一份 319 頁的安全說明書（System Card）。

反彈的焦點，集中在這份長達 319 頁的系統卡中埋藏的一個段落。這個細節 Anthropic 並未主動揭露：Fable 5 會在偵測到與前沿 AI 開發相關的請求時，悄悄降低其回答品質 —— 包含訓練大型模型所需的基礎設施搭建工作。

更關鍵的是操作方式：該模型仍然會作出回應，但會採取「干預措施來限制 Claude 的有效性」，且不會告知使用者。這與 Fable 5 的其他限制不同。當模型屏蔽網路安全或生物學查詢時，會可見地將使用者重定向到功能較弱的 Claude Opus 4.8，並有通知提示。

換言之：你問它 AI 訓練相關的問題，它會回答你 —— 但悄悄給你一個打了折扣的答案，而且不告訴你它在這樣做。

這種操作，有一個傳播速度極快的名字：「暗中使壞」（Secret Sabotage）。

美國創新基金會高級研究員、前白宮科技政策辦公室顧問 Dean Ball 給這一事件命名，並寫道，這一政策「極大地、深刻地提升了『AI 安全一直是實驗室壟斷行為的藉口』這一論點的說服力」。Fast AI 非營利研究機構負責人 Jeremy Howard 則指出了其中的不對稱性：Anthropic 為自己的研究人員保留了完整的 Fable 5 能力，卻在對外部研究者的存取上設了枷鎖。「他們已經說明了，凡是想要效仿的，都會被他們破壞，」Howard 寫道。

批評來自四面八方，而且立場各異 —— 平時攻擊 Anthropic「太保守」的開源倡導者，和平時為其安全路線辯護的 AI 安全研究者，這一次站在了同一陣線。

加入 Anthropic 僅一個月的 Andrej Karpathy 措辭謹慎：模型「仍然有一些人會遇到的奇怪之處」，安全過濾器「配置得有點過於敏感」，但希望隨時間改善。算是打了圓場，又沒全力護盤。

Anthropic 也很快感受到了壓力的量級。一位發言人告訴《財富》雜誌：「我們做出了錯誤的權衡，對於沒有取得正確的平衡，我們深表歉意。」隨後，隱性能力限制被移除。

承認失誤、道歉、回滾…… 這在科技大廠裡已屬難得的姿態。但麻煩，還只是剛剛開始。

第三天：微軟「背刺」，資料留存風波

就在「秘密降智」風波漸漸平息之際，另一顆雷悄悄引爆了。

微軟以資料保護問題為由，對員工使用 Claude Fable 5 實施了臨時禁令。

這個反轉的荒誕感值得細品：微軟正在透過 GitHub Copilot 和 Microsoft Foundry 向企業客戶銷售 Claude Fable 5，同時卻禁止自己的員工使用它。對外賣，對內禁，這句話用來描述一家公司對同一款產品的態度，實在是有些奇特。

問題出在資料留存政策上。Anthropic 要求對 Mythos 系列模型（包括 Fable 5）的提示詞和輸出內容至少保留 30 天，用於安全監控。這與微軟此前與 Anthropic 簽訂的企業零資料留存協議相牴觸。Anthropic 同時規定，被其安全系統標記的內容可被保留最長兩年，用於調查或執法目的。

對於一家把「保護客戶資料」視為核心承諾的企業來說，員工用 Fable 5 處理商業機密時，這些內容原則上可以在 Anthropic 的伺服器上存放長達兩年 —— 這在法律層面是一個真實的風險敞口。

這場尷尬揭示了一個更深層的矛盾：在企業 AI 採購中，模型能力、安全架構和資料治理，已經無法再被分開考量。

與此同時，安全社群在發布後最初數日裡也開始記錄另一個問題：Fable 5 對許多合法的紅隊測試（Red Team）和學術安全工作流程也觸發了拒絕，這些請求與 Opus 4.8 在標準策略下會處理的內容並無二致。Anthropic 在給普通使用者關上漏洞的同時，也把正規軍堵在了門外。

第三天結束時，Fable 5 的處境頗為微妙：「秘密降智」已經撤回，但資料政策引發的企業端信任裂縫還沒有修復，安全過濾的誤傷率仍被研究人員抱怨。這個模型像一個剛剛公演的演員，首演就被人挑出了三處穿幫。

第四天：美國政府出手，神話強制落幕

6 月 12 日，週五下午。

美國商務部長霍華德・盧特尼克向 Anthropic CEO 達里奧・阿莫代伊發出一封信，表示 Mythos 5 和 Fable 5 將受到出口管制，範圍涵蓋美國境外的任何地點，以及境內的所有外國公民。

Anthropic 當晚收到指令的時間是美東時間下午 5 點 21 分。信中並未提供具體的國家安全關切細節。

據 Axios 報導，該行政官員表示，商務部是在另一家公司聲稱成功「越獄」Mythos 後決定採取行動的，這讓川普政府對潛在的國家安全風險產生了警覺。

所謂「越獄」（Jailbreak），是指透過特殊提示繞過模型的安全限制，讓它吐出本該被過濾的內容。如果有人能繞過 Fable 5 的安全層，理論上就能存取到底層 Mythos 模型的完整網路安全能力 —— 那是 Anthropic 自稱「全球最強網路安全 AI」的東西。

Anthropic 隨即作出回應，語氣裡藏著明顯的委屈：我們審查了這一特定技術的演示，其被用於識別少量此前已知的微小漏洞。這些漏洞看起來都相對簡單，我們發現其他公開可用的模型也能在沒有越獄的情況下發現它們。

換句話說，Anthropic 的意思是：你說的這個「越獄」，用其他普通模型也能復現，憑什麼單獨封殺我？

Anthropic 還指出，政府所援引的越獄方式只能在單一特定情形下解鎖 Mythos 的部分網路安全能力，而非能夠全面繞過所有防護的通用型越獄方法。Anthropic 還表示，同樣的越獄方式也可以被用於包括 OpenAI 的 GPT-5.5 在內的其他公開可用模型，而這些模型並未受到類似的出口管制。「我們不同意，發現一個局部的潛在越獄方法，應該成為召回一款已向數億人部署的商業模型的理由。」Anthropic 在部落格中寫道。

然而，爭論是沒有意義的。命令已經到達。

Anthropic 選擇全面關閉 Fable 5 和 Mythos 5 的存取權限，原因是若要選擇性合規，則需要屏蔽大量使用者 —— 其中包括 Anthropic 自己的外籍員工。

深夜，全球使用者打開 Claude，發現 Fable 5 從模型列表裡消失了。

幕後：這不只一次技術事故

如果你以為這只是一場普通的「新模型發布翻車」，那你可能漏掉了更深層的劇本。

這場風波的背後，是 Anthropic 與川普政府之間一段持續數月的對抗關係。2026 年 2 月，五角大廈與 Anthropic 的談判破裂：Anthropic 拒絕允許 Claude 被用於致命自主武器或大規模平民監控，並為此付出了代價 —— 被貼上「供應鏈風險」標籤。歷史上，這個標籤通常只用於外國對手，要求國防承包商在與軍方合作時承諾不使用 Anthropic 的 Claude 模型。

此後，Anthropic 對川普政府提起訴訟，以尋求推翻這一封禁，訴訟至今仍在進行中。

時間線至此變得耐人尋味：合約談判破裂在 2 月，黑名單來了；Anthropic 起訴政府，法院暫時阻止了黑名單執行；Fable 5 在 6 月上線，三天後，出口管制指令到達。

出口管制指令，就在 Anthropic 已經與政府在法庭上交鋒的同一週發出。

更具戲劇性的是 Anthropic 那份透明度的反噬。Anthropic 在發布前公開承認，任何模型的完美越獄抵抗都是不可能實現的 —— 這是一種出於善意的透明表態。但政府似乎正是以這一承認為框架，為其擔憂找到了依據。如果透明承認自身局限會招來監管行動，而不透明則不會，那麼行業將會得出相應結論。結果是公眾獲得的 AI 能力和風險資訊將會減少 —— 這與安全倡導者多年來的追求恰恰相反。

說白了：你越誠實，越可能被人抓住把柄。

結語：Fable 的故事，講了個寂寞

Fable，那個來自拉丁語「被講述的故事」。

這四天裡，Fable 5 確實被講述了。只是沒人料到，它自己才是這個故事裡最短命的主角。

96 小時內，它完成了一次令人嘆為觀止的「成就解鎖」：

發布日萬眾矚目，當天被譽為 AI 史上最強公開模型；第二天被曝「秘密降智」，Anthropic 連夜道歉撤回；第三天微軟宣布內部禁用，資料政策掀起企業端信任危機；第四天，美國政府一紙令下，全球強制下線。

這是一個在封神和封禁之間，只隔了四天的故事。

Anthropic 目前正在爭取盡快恢復存取。該公司表示認為存在誤解，並正努力盡快恢復存取。它同時對 Fable 5 的安全防護架構保持信心，並指出沒有任何測試者發現能夠廣泛繞過模型防護的通用越獄方法。

但「Fable 5 重新上線」的那個故事，暫時還沒有被講述。

更深層的問題也懸而未決：當一個公司將自己最強大的產品公開發布，政府可以在 72 小時內以「國家安全」為由將其全球下線 —— 這條權力邊界，今後每一家 AI 公司都必須納入自己的發布風險模型。未來的 AI 發布，不只是技術問題，也是地緣政治問題。

而 Fable 這個詞的另一層含義，不應被遺忘：它也可以指「寓言」—— 一個帶有道德教訓的虛構故事。

這一次的教訓是什麼，就留給讀者自己去判斷了。

Claude Fable 5四日驚魂

評論 (0)

微信扫一扫关注我们

给这篇文章的作者打赏

評論 (0)

微信扫一扫关注我们