AI漏洞自動開採釀國安疑慮 美國禁用Anthropic Fable 5
美國政府於本月12日向人工智慧(AI)公司 Anthropic 發布出口管制指令,要求暫停旗下兩款先進AI模型 Fable 5 及 Mythos 5 供外國國民使用。此舉源於對這些模型具備「機器速度」自動利用網路漏洞能力的國安疑慮,對AI技術安全與監管平衡提出嚴峻挑戰。
Anthropic 公司推出的 Fable 5 模型,被形容為該公司迄今最強大的 AI 模型,源自其非公開的 Claude Mythos 核心,並宣稱已調整為「適合一般用途」。然而,外媒報導指出,這款模型展現出卓越的智慧水準,能與 OpenAI 的 GPT-5.5 及 Anthropic 自家的 Opus 4.8 等頂尖模型匹敵,特別是在處理複雜的程式碼除錯任務上,Fable 5 的表現甚至超越了 Opus 4.8。據測試,Fable 5 能辨識並修復 Opus 4.8 未能發現的資料提取問題,其定價也相對高昂,每百萬個輸入 Token 為 10 美元,輸出 Token 則為 50 美元,高於 GPT-5.5 和 Opus 4.8。
儘管 Anthropic 已立即切斷對 Fable 5 和 Mythos 5 的訪問權限,並正與川普政府官員溝通解決方案,但公司聲稱 Fable 5 的安全防護措施足以防止惡意使用。Anthropic 認為,這次禁用可能與近期發現的「越獄」(jailbreak)漏洞有關,但強調這些漏洞並非全新且不具重大意義,其他公開模型如 OpenAI 的 GPT-5.5 也能發現類似漏洞。然而,有資安專家指出,像 Anthropic 旗下受限制的 Claude Mythos Preview 這類進攻型AI模型,在測試中能以高達 83.1% 的成功率自主利用漏洞,甚至能利用 27 年前的 OpenBSD 補丁來攻擊未修補的系統,顯示傳統資安措施已難以應對。
資安領域正進入「機器速度」威脅時代,AI 模型能在數分鐘內發現、武器化並執行漏洞利用。這意味著企業的傳統網路邊界已失效,急需新的安全框架來保護「邏輯地平線」(logic horizon),即 AI 模型將自然語言轉化為關鍵業務操作的精確點。新的防禦措施必須包含執行控制、身分與動態授權,以及資料治理。例如,將推論層與執行層分離,讓 AI 只提出行動建議,由獨立的非 AI 微服務或人工驗證其權限,並透過系統提示隔離,確保核心操作指令不受外部輸入影響。微軟公司也對內部員工使用 Fable 5 實施了限制,與其對 Anthropic 其他模型的態度不同。