AI 公司 Anthropic 因內容管理系統配置失誤,意外曝光代號「Capybara」的全新模型 Claude Mythos 相關內部文件,揭露一款被形容為「能力飛躍」、卻也帶來前所未見網路安全風險的下一代 AI 系統。Claude Mythos 是一款具有劃時代意義的全新模型。
Anthropic 此次外洩文件近 3000 份,包含未發布的部落格草稿與產品規劃,迅速在科技圈掀起波瀾。
根據《財富 (Fortune)》雜誌取得的資料,Claude Mythos 已完成訓練,定位為超越現行最強模型 Opus 的全新層級,在程式編寫、學術推理與網路安全等測試中表現遠優於 Claude Opus 4.6。
然而,Claude Mythos 強大的網路攻防能力卻令 Anthropic 自身感到擔憂。
文件顯示,Anthropic 公司內部評估指出,Mythos「預示著即將出現一波新型模型,其利用漏洞的能力將遠超過防禦者的應對速度」,因此決定採取較過往更謹慎的發布策略。
外洩的部落格草稿進一步說明,由於 Mythos 屬於大型且計算密集的模型,運作成本極高,公司將先以早期體驗形式提供給特定組織,尤其側重於網路防禦應用,旨在協助相關單位在 AI 驅動的攻擊浪潮來臨前,強化其程式碼庫的穩健性。
此外,文件亦意外披露執行長 Dario Amodei 將參與一場於英國莊園舉辦的歐洲企業執行長閉門峰會,疑似為新產品進行高端推廣。
Anthropic 已向《財富》證實確有開發此模型,並將其描述為 AI 能力的「重大飛躍」,但強調因配置疏失而外洩的內容包含未定稿資訊與廢棄素材。
Anthropic 發言人表示,此次事件源於一個外部內容管理工具的設定錯誤,目前已封鎖相關資料存取路徑。
此次外洩不僅提前揭露 AI 競賽的下一階段進展,更突顯尖端技術的雙面刃本質,也就是當模型的智慧與能力達到新高度,其潛在風險與社會影響也將同步加劇,迫使開發者必須在創新與安全之間取得更艱難的平衡。
新聞來源 (不包括新聞圖片): 鉅亨網