Anthropic發布Claude Fable 5模型 設自動降級機制防濫用 惟早前研究示AI半小時可生成Windows核心漏洞攻擊程式

人工智能(AI)初創企業Anthropic週二(9日)正式發布其全新AI模型Claude Fable 5,這是首款向公眾開放的Mythos級別模型,標誌著該公司在AI技術應用上的重要里程碑。Fable 5在軟件工程、知識工作、視覺辨識及科學研究等範疇展現出接近業界最高水平的能力。與此同時,Anthropic亦為少數網絡防禦機構與基建供應商推出Claude Mythos 5,其底層模型與Fable 5相同,但在部分領域解除了安全限制。 市場普遍關注Mythos級模型所帶來的潛在風險。Anthropic早前的內部研究曾指出,同一Mythos級模型能夠在短短31分鐘內,將新披露的Windows核心漏洞轉化為可用的攻擊程式,足見其強大破壞力。面對此一挑戰,Fable 5內置多重防護機制,包括「自動降級」功能,會自動將高風險查詢轉發至能力較低的Claude Opus 4.8模型處理,冀在模型強大能力與安全可控之間取得平衡。 據Anthropic向媒體披露的研究顯示,其「前沿紅隊」利用Mythos Preview模型,針對今年1月及2月公開的Mozilla Firefox及Microsoft Windows內核漏洞進行測試。研究人員特意選取模型知識截止日期之後才披露的漏洞,以評估AI將公開修補程式(patch)轉變為有效攻擊的速度。結果顯示,在21個Windows內核漏洞中,Mythos成功令其中18個觸發「藍屏死機」(blue screen of death),並生成了8個獨立的漏洞利用程式,最快的僅需31分鐘,最長亦只耗時約5.7小時。此外,針對Firefox的18個安全修補程式,Mythos亦構建出8個可執行程式碼的漏洞利用程式。 Anthropic估計,Mythos生成上述Windows權限提升攻擊程式的API成本約為15,700美元(約12萬港元),即每個攻擊程式約2,000美元(約1.56萬港元)。值得留意的是,該研究同時指出,類似的漏洞發現能力並非Mythos獨有,部分開源模型及OpenAI同類模型GPT-5.5-Cyber亦能達到相近水平。 儘管Mythos級模型展現出強大的攻擊潛力,Anthropic卻在不到三個月內,從最初認定「現有防護措施不足以應對、僅限極少數機構使用」,迅速轉變為推出供公眾使用的版本。Anthropic產品管理、研究及實驗室主管Dianne Penn表示,公司在發布前已進行內部安全評估、內部紅隊測試及外部對抗性測試,並強調:「我們在發布時刻意採取更保守的態度。」 Fable 5的防護機制主要透過查詢路由層實現。當模型接收到涉及網絡攻擊、生物學、化學及模型蒸餾(model distillation)等高風險查詢時,會自動將其轉發至不具備完成此類高風險任務推理能力的Claude Opus 4.8,從而充當「安全閥」。Anthropic預期,隨著發布後持續測試,這類將部分合法科學或安全研究工作誤轉至Opus 4.8的情況會逐漸減少。 除了公眾版Fable 5,Anthropic亦推出Claude Mythos 5,供已使用Claude Mythos Preview的用户(包括Project Glasswing的合作夥伴)使用。該模型將放寬部分安全防護,並與美國政府協作部署,僅限於小部分網絡防禦者及基礎設施供應商使用。據Anthropic稱,Claude Mythos 5在知識工作、軟件工程、科學研究等範疇的表現,全面超越OpenAI及Google DeepMind的同類模型。 定價方面,Fable 5的費用為Anthropic旗下Opus模型的兩倍,是公司目前最昂貴的版本。然而,Dianne Penn解釋稱:「成本是相對的。Mythos級模型提供更高的智能和性能,客户每項任務的總成本反而更低。」 目前,美國特朗普政府已開始落實新的AI安全行政命令,旨在評估日益強大的AI模型所帶來的國家安全風險。在此背景下,Anthropic正致力建立更標準化的「受信任存取計劃」,以便向經審核的用户擴大提供Mythos 5,惟Dianne Penn表示目前未有明確時間表。OpenAI亦已建立類似模式,逐步推出具網絡能力的模型,僅向經審核的安全研究人員、政府合作夥伴及企業合作夥伴提供無限制存取權限。 儘管Anthropic相信其新型防護機制足以令Fable 5安全地供公眾使用,但同一底層模型僅需31分鐘就能寫出Windows內核漏洞攻擊程式的事實,無疑為網絡安全界敲響了警鐘,突顯了先進AI技術在推動發展同時,亦需面對嚴峻網絡安全挑戰的兩難局面。
TimeNews
06-10 17:11Anthropic發布Claude Fable 5模型 設自動降級機制防濫用 惟早前研究示AI半小時可生成Windows核心漏洞攻擊程式
06-10 17:11比亞迪據報暫緩土耳其設廠投資 集中資源佈局歐洲市場
06-10 17:11僱員醫保住院保障需求急增16.5% 理大GUM指數揭醫療成本與使用雙升隱憂
06-10 17:11人民幣在岸價收市走弱 短期承壓待美國通脹數據
06-10 17:11【跨境資金】陳茂波:中央鼓勵合規資金流入香港 整治違規炒股 SpaceX禁港資反損美方
06-10 17:08港股六連跌失守24500關 恆指創逾兩月低 聯想重挫逾9%跑輸藍籌 國泰挫逾6%
06-10 17:07市場消息:SK海力士最快8月美國上市 ADR申請料月內獲批
06-10 17:07台積電財務長黃仁昭:通脹推高成本 不排除加價惟不會是數倍暴漲
06-10 17:07SK海力士傳最快8月美國上市 冀把握AI熱潮機遇
06-10 17:07比亞迪據報暫緩土耳其設廠計劃 匈牙利工廠成歐洲首要據點
06-10 17:07華潤電力(00836)五月售電量按年增逾一成 光伏業務表現亮眼
06-10 17:07晨訊科技(02000)公佈五月營運數據,總收入按月增長逾四成
06-10 17:07中汽協:5月內地汽車銷量按年跌2.1% 新能源車續強勁增長 協會籲穩定政策促消費
06-10 17:07恆指期貨結算:6月期指報24274點挫349點 低水百餘點
06-10 17:06江山控股首五月太陽能發電量按年挫17.4% 總裝機量維持300兆瓦
06-10 17:06華商能源(00206)夥洲際船務(02409)合組企 斥8500萬美元建LNG載運加註船
06-10 17:06渣打集團委任資深銀行家Tanate Phutrakul為獨立非執董 2026年7月生效
06-10 17:06OSL數字證券夥方德證券拓展數碼資產服務
06-10 17:06微盟據報聯手微信團隊 開發並測試接入微信AI生態
06-10 17:06新世界旗下九龍塘滶藴本週五發售28夥 市傳反應熱烈 發展商料餘貨具提價空間