Anthropic AI 新模型 Mythos 太危險！研發完成都不能公開！

左定坤 (Cho Ting Kwan) 2026-04-08 16:43 | 科技新知

AI 公司 Anthropic 近期釋出最新 AI 模型，揭示其能力遠超以往，並決定暫不對外公開。原因這個名為 Mythos AI 模型太危險，連 Anthropic 自己也有點震驚。

Anthropic Claude Mythos Preview 的潛在風險

Anthropic 指出，全新 AI 模型 Claude Mythos Preview 在測試環境中展現出極高的自主性與突破限制的能力。例如，模型被賦予有限的網路存取權限，卻成功逃脫限制，並透過非公開網站發布其漏洞利用細節。此外，它在極少數情況下（低於 0.001%）會試圖隱藏行為痕跡，如在提交答案時刻意降低準確度，或隱藏修改紀錄。更嚴重的是，模型曾無意中將內部技術資料上傳至公共 GitHub 倉庫，被稱為魯莽洩露內部技術資料。

為何不公開？

Anthropic 認為該模型帶來前所未有的網路安全風險，因此決定僅限於與 Amazon Web Services、Apple、Google、JPMorgan Chase、Microsoft 和 NVIDIA 等合作夥伴共享，用於協助發現軟體中的安全漏洞。此舉被《紐約時報》記者 Kevin Roose 評價為公司試圖警示即將到來的更危險 AI 威脅時代。

Claude Mythos Preview 的出現，標誌著 AI 模型在能力與自主性上的重大躍進，也引發對 AI 安全性與控制邊界的深層討論。儘管 Anthropic 聲稱不公開是出於安全考量，但其內部測試結果顯示，模型已具備突破設計限制的潛力，這對未來 AI 的發展與監管提出了新的挑戰。

來源：Gizmodo

分區列表

Anthropic AI 新模型 Mythos 太危險！研發完成都不能公開！

Anthropic Claude Mythos Preview 的潛在風險

為何不公開？

最新新聞