HotView 熱視 Claude Fable 5四日驚魂

Claude Fable 5四日驚魂

從萬眾期待的「AI 封神時刻」,到美國政府一紙禁令強制下線 —— 這個名字中有 5 的模型,沒活過 5 天。

讓我們先停下來,感受一下這件事的荒誕程度。

2026 年 6 月 9 日,Anthropic 將它最強大的模型 Claude Fable 5 對外正式發布。那一天,開發者社群沸騰了,評測帖子在 𝕏 上洗版,有人說它「碾壓一切」,有人說它「改寫了 AI 的上限」。Anthropic 的 Mythos 系列,這個此前只對五六家機構開放的神秘模型家族,終於向普通公眾打開了一道門縫。

然後,四天後,這扇門被人從外面焊死了。

6 月 12 日,美國商務部長霍華德・盧特尼克(Howard Lutnick)向 Anthropic CEO Dario Amodei 寄出一封信:以「國家安全」為由,禁止 Fable 5 和 Mythos 5 向任何外國公民開放存取 —— 無論這些人身處美國境內還是境外,甚至包括 Anthropic 內部的外籍員工。Anthropic 當晚收到指令的時間,是美東時間下午 5 點 21 分。

到晚上,Fable 5 在全球範圍內下線。

11111.webp

四天。96 個小時。一場從高光到猝死的極速墜落。

第一天:神話降臨

Fable 這個詞來自拉丁語 fabula,意為「被講述的故事」,與希臘語 mythos 同根。Anthropic 在命名上頗費心思:Mythos 系列是為少數精英保留的神話,Fable 則是普羅大眾可以聽到的那個故事。

6 月 9 日,Anthropic 發布了 Claude Fable 5,這是其 Mythos 模型的首個公開版本,該公司稱其在軟體工程、知識工作和視覺方面表現卓越,但附帶嚴格的安全限制。與此同時,Anthropic 還發布了一款雙胞胎產品:Claude Mythos 5—— 與 Fable 5 使用相同底層模型,但移除了網路安全領域的安全過濾層,僅供經過審查的網路防禦者和關鍵基礎設施營運商使用。Anthropic 稱 Mythos 5 是全球最強的網路安全模型。

通俗地理解:Mythos 5 是上了槍彈的武器,Fable 5 是同款槍,但出廠自帶保險。

就 API 定價而言,Fable 5 的能力在 Anthropic 公開發布的模型中首屈一指,價格約為 Claude Mythos Preview 的一半以下。在訂閱方案上,透過 6 月 22 日,Fable 5 將在 Pro、Max、Team 和 Enterprise 等付費套餐中免費提供。

科技圈的讚美潮水般湧來。沃頓商學院副教授 Ethan Mollick 在部落格寫道,Fable 5「在我用過的所有公開模型中,以相當大的差距超越了其他所有模型」。前 OpenAI 共同創辦人、特斯拉 AI 總監 Andrej Karpathy(他上個月剛宣布加入 Anthropic)在 𝕏 上稱 Fable 5 是一次「超級令人興奮的發布」,是「值得大版本號升級的跨越式進步」。

這一天,Anthropic 的 Mythos 神話,似乎真的成真了。

第二天:「秘密降智」事件爆發

好景不長。發布僅 24 小時後,一場風暴在 AI 社群悄然醞釀。

起因,是一份 319 頁的安全說明書(System Card)。

反彈的焦點,集中在這份長達 319 頁的系統卡中埋藏的一個段落。這個細節 Anthropic 並未主動揭露:Fable 5 會在偵測到與前沿 AI 開發相關的請求時,悄悄降低其回答品質 —— 包含訓練大型模型所需的基礎設施搭建工作。

更關鍵的是操作方式:該模型仍然會作出回應,但會採取「干預措施來限制 Claude 的有效性」,且不會告知使用者。這與 Fable 5 的其他限制不同。當模型屏蔽網路安全或生物學查詢時,會可見地將使用者重定向到功能較弱的 Claude Opus 4.8,並有通知提示。

換言之:你問它 AI 訓練相關的問題,它會回答你 —— 但悄悄給你一個打了折扣的答案,而且不告訴你它在這樣做。

這種操作,有一個傳播速度極快的名字:「暗中使壞」(Secret Sabotage)。

美國創新基金會高級研究員、前白宮科技政策辦公室顧問 Dean Ball 給這一事件命名,並寫道,這一政策「極大地、深刻地提升了『AI 安全一直是實驗室壟斷行為的藉口』這一論點的說服力」。Fast AI 非營利研究機構負責人 Jeremy Howard 則指出了其中的不對稱性:Anthropic 為自己的研究人員保留了完整的 Fable 5 能力,卻在對外部研究者的存取上設了枷鎖。「他們已經說明了,凡是想要效仿的,都會被他們破壞,」Howard 寫道。

批評來自四面八方,而且立場各異 —— 平時攻擊 Anthropic「太保守」的開源倡導者,和平時為其安全路線辯護的 AI 安全研究者,這一次站在了同一陣線。

加入 Anthropic 僅一個月的 Andrej Karpathy 措辭謹慎:模型「仍然有一些人會遇到的奇怪之處」,安全過濾器「配置得有點過於敏感」,但希望隨時間改善。算是打了圓場,又沒全力護盤。

Anthropic 也很快感受到了壓力的量級。一位發言人告訴《財富》雜誌:「我們做出了錯誤的權衡,對於沒有取得正確的平衡,我們深表歉意。」隨後,隱性能力限制被移除。

承認失誤、道歉、回滾…… 這在科技大廠裡已屬難得的姿態。但麻煩,還只是剛剛開始。

第三天:微軟「背刺」,資料留存風波

就在「秘密降智」風波漸漸平息之際,另一顆雷悄悄引爆了。

微軟以資料保護問題為由,對員工使用 Claude Fable 5 實施了臨時禁令。

這個反轉的荒誕感值得細品:微軟正在透過 GitHub Copilot 和 Microsoft Foundry 向企業客戶銷售 Claude Fable 5,同時卻禁止自己的員工使用它。對外賣,對內禁,這句話用來描述一家公司對同一款產品的態度,實在是有些奇特。

問題出在資料留存政策上。Anthropic 要求對 Mythos 系列模型(包括 Fable 5)的提示詞和輸出內容至少保留 30 天,用於安全監控。這與微軟此前與 Anthropic 簽訂的企業零資料留存協議相牴觸。Anthropic 同時規定,被其安全系統標記的內容可被保留最長兩年,用於調查或執法目的。

對於一家把「保護客戶資料」視為核心承諾的企業來說,員工用 Fable 5 處理商業機密時,這些內容原則上可以在 Anthropic 的伺服器上存放長達兩年 —— 這在法律層面是一個真實的風險敞口。

這場尷尬揭示了一個更深層的矛盾:在企業 AI 採購中,模型能力、安全架構和資料治理,已經無法再被分開考量。

與此同時,安全社群在發布後最初數日裡也開始記錄另一個問題:Fable 5 對許多合法的紅隊測試(Red Team)和學術安全工作流程也觸發了拒絕,這些請求與 Opus 4.8 在標準策略下會處理的內容並無二致。Anthropic 在給普通使用者關上漏洞的同時,也把正規軍堵在了門外。

第三天結束時,Fable 5 的處境頗為微妙:「秘密降智」已經撤回,但資料政策引發的企業端信任裂縫還沒有修復,安全過濾的誤傷率仍被研究人員抱怨。這個模型像一個剛剛公演的演員,首演就被人挑出了三處穿幫。

第四天:美國政府出手,神話強制落幕

6 月 12 日,週五下午。

美國商務部長霍華德・盧特尼克向 Anthropic CEO 達里奧・阿莫代伊發出一封信,表示 Mythos 5 和 Fable 5 將受到出口管制,範圍涵蓋美國境外的任何地點,以及境內的所有外國公民。

Anthropic 當晚收到指令的時間是美東時間下午 5 點 21 分。信中並未提供具體的國家安全關切細節。

據 Axios 報導,該行政官員表示,商務部是在另一家公司聲稱成功「越獄」Mythos 後決定採取行動的,這讓川普政府對潛在的國家安全風險產生了警覺。

所謂「越獄」(Jailbreak),是指透過特殊提示繞過模型的安全限制,讓它吐出本該被過濾的內容。如果有人能繞過 Fable 5 的安全層,理論上就能存取到底層 Mythos 模型的完整網路安全能力 —— 那是 Anthropic 自稱「全球最強網路安全 AI」的東西。

Anthropic 隨即作出回應,語氣裡藏著明顯的委屈:我們審查了這一特定技術的演示,其被用於識別少量此前已知的微小漏洞。這些漏洞看起來都相對簡單,我們發現其他公開可用的模型也能在沒有越獄的情況下發現它們。

換句話說,Anthropic 的意思是:你說的這個「越獄」,用其他普通模型也能復現,憑什麼單獨封殺我?

Anthropic 還指出,政府所援引的越獄方式只能在單一特定情形下解鎖 Mythos 的部分網路安全能力,而非能夠全面繞過所有防護的通用型越獄方法。Anthropic 還表示,同樣的越獄方式也可以被用於包括 OpenAI 的 GPT-5.5 在內的其他公開可用模型,而這些模型並未受到類似的出口管制。「我們不同意,發現一個局部的潛在越獄方法,應該成為召回一款已向數億人部署的商業模型的理由。」Anthropic 在部落格中寫道。

然而,爭論是沒有意義的。命令已經到達。

Anthropic 選擇全面關閉 Fable 5 和 Mythos 5 的存取權限,原因是若要選擇性合規,則需要屏蔽大量使用者 —— 其中包括 Anthropic 自己的外籍員工。

深夜,全球使用者打開 Claude,發現 Fable 5 從模型列表裡消失了。

幕後:這不只一次技術事故

如果你以為這只是一場普通的「新模型發布翻車」,那你可能漏掉了更深層的劇本。

這場風波的背後,是 Anthropic 與川普政府之間一段持續數月的對抗關係。2026 年 2 月,五角大廈與 Anthropic 的談判破裂:Anthropic 拒絕允許 Claude 被用於致命自主武器或大規模平民監控,並為此付出了代價 —— 被貼上「供應鏈風險」標籤。歷史上,這個標籤通常只用於外國對手,要求國防承包商在與軍方合作時承諾不使用 Anthropic 的 Claude 模型。

此後,Anthropic 對川普政府提起訴訟,以尋求推翻這一封禁,訴訟至今仍在進行中。

時間線至此變得耐人尋味:合約談判破裂在 2 月,黑名單來了;Anthropic 起訴政府,法院暫時阻止了黑名單執行;Fable 5 在 6 月上線,三天後,出口管制指令到達。

出口管制指令,就在 Anthropic 已經與政府在法庭上交鋒的同一週發出。

更具戲劇性的是 Anthropic 那份透明度的反噬。Anthropic 在發布前公開承認,任何模型的完美越獄抵抗都是不可能實現的 —— 這是一種出於善意的透明表態。但政府似乎正是以這一承認為框架,為其擔憂找到了依據。如果透明承認自身局限會招來監管行動,而不透明則不會,那麼行業將會得出相應結論。結果是公眾獲得的 AI 能力和風險資訊將會減少 —— 這與安全倡導者多年來的追求恰恰相反。

說白了:你越誠實,越可能被人抓住把柄。

結語:Fable 的故事,講了個寂寞

Fable,那個來自拉丁語「被講述的故事」。

這四天裡,Fable 5 確實被講述了。只是沒人料到,它自己才是這個故事裡最短命的主角。

96 小時內,它完成了一次令人嘆為觀止的「成就解鎖」:

發布日萬眾矚目,當天被譽為 AI 史上最強公開模型;第二天被曝「秘密降智」,Anthropic 連夜道歉撤回;第三天微軟宣布內部禁用,資料政策掀起企業端信任危機;第四天,美國政府一紙令下,全球強制下線。

這是一個在封神和封禁之間,只隔了四天的故事。

Anthropic 目前正在爭取盡快恢復存取。該公司表示認為存在誤解,並正努力盡快恢復存取。它同時對 Fable 5 的安全防護架構保持信心,並指出沒有任何測試者發現能夠廣泛繞過模型防護的通用越獄方法。

但「Fable 5 重新上線」的那個故事,暫時還沒有被講述。

更深層的問題也懸而未決:當一個公司將自己最強大的產品公開發布,政府可以在 72 小時內以「國家安全」為由將其全球下線 —— 這條權力邊界,今後每一家 AI 公司都必須納入自己的發布風險模型。未來的 AI 發布,不只是技術問題,也是地緣政治問題。

而 Fable 這個詞的另一層含義,不應被遺忘:它也可以指「寓言」—— 一個帶有道德教訓的虛構故事。

這一次的教訓是什麼,就留給讀者自己去判斷了。

評論 (0)

暫無評論,快來搶沙發吧
微信
微信扫一扫关注我们

微信扫一扫关注我们