OpenAI與Anthropic相繼發布資安AI模型 引業界關注與潛在風險
兩大人工智慧(AI)巨頭 OpenAI 與 Anthropic 近日先後發表專為網路安全領域設計的 AI 模型,其強大功能在提升防禦能力的同時,也因潛在風險引發業界高度關注。
OpenAI 於昨日(29日)推出 GPT 5.4 Cyber,此為其旗艦模型 GPT 5.4 的變體,主要鎖定網路防禦應用。OpenAI 表示,GPT 5.4 Cyber 在用於合法防禦目的時,對網路安全相關的查詢限制較少。該模型強化了多項進階安全功能,例如二進位反向工程(binary reverse engineering),這使得研究人員無需取得原始碼,也能分析編譯後的軟體,以找出惡意軟體及漏洞。
然而,考量到其較為寬鬆的使用權限,OpenAI 宣布 GPT 5.4 Cyber 將透過其「Trusted Access for Cyber programme」專案,僅限於經過審核的資安供應商、組織及研究人員使用。
在此之前,Anthropic 已於上週發表 Claude Mythos Preview 模型。此模型據稱能辨識出主流作業系統與網路瀏覽器中數千個過去未被發現的高嚴重性漏洞。早在今年三月下旬,一場資料外洩事件便曾揭露 Anthropic 正在開發一款 AI 模型,當時其內部工程師已警告該模型可能帶來「前所未有的網路安全風險」。
Claude Mythos Preview 後來以受限形式發布,作為 Anthropic「Project Glasswing」專案的一部分,旨在利用這項技術在落入惡意份子手中前,強化關鍵軟體的安全性。Anthropic 強調,由於該模型可能促成的網路攻擊規模與複雜度過高,因此不適合全面公開發布。
根據測試結果,Claude Mythos Preview 能夠在支撐全球多數伺服器的 Linux kernel 中找到未知缺陷,並將這些缺陷串聯成可運作的攻擊手法,足以讓攻擊者完全控制受影響的裝置。目前,Mythos Preview 的存取權限僅限於 12 個創始合作夥伴,包含 AWS、蘋果(Apple)、微軟(Microsoft)、谷歌(Google)及思科(Cisco),以及超過 40 個負責關鍵軟體基礎設施的組織。