Il modello di intelligenza artificiale Claude Mythos, sviluppato da Anthropic, avrebbe individuato diverse vulnerabilità nei sistemi informatici classificati della National Security Agency (NSA) durante un test di sicurezza controllato. La notizia, riportata da fonti vicine all’Associated Press e ripresa da diverse testate internazionali, sta alimentando un acceso dibattito sulle capacità sempre più avanzate dei modelli AI in ambito cyber-security.
Secondo quanto emerso, il test rientrava nel progetto “Glasswing”, un’iniziativa congiunta tra Anthropic e agenzie governative statunitensi finalizzata a valutare la capacità dei sistemi di intelligenza artificiale di individuare falle software in ambienti altamente protetti. In questo contesto, Claude Mythos avrebbe rilevato vulnerabilità nei sistemi della NSA in poche ore, un risultato che ha sorpreso gli stessi analisti coinvolti nell’esperimento.
Test simulato e nessun attacco reale
Le autorità hanno precisato che si è trattato di un ambiente di simulazione isolato, privo di connessione a Internet e con finalità esclusivamente difensive. Non si è quindi verificato alcun “hack” reale dei sistemi della NSA, ma l’identificazione di possibili debolezze già presenti nel software sottoposto a test.
Una fonte ufficiale citata dall’Associated Press ha chiarito che la capacità del modello di individuare vulnerabilità in tempi così rapidi non implica necessariamente la possibilità di sfruttarle operativamente in un contesto reale.
Tensioni tra sicurezza e controllo dell’AI
L’episodio arriva in un momento di crescente tensione tra il governo statunitense e Anthropic. L’azienda, secondo diverse ricostruzioni, avrebbe subito restrizioni sull’accesso ai propri modelli avanzati da parte di utenti stranieri, dopo preoccupazioni legate alla sicurezza nazionale.
Il caso ha riacceso il dibattito sull’uso delle AI nei settori critici: da un lato strumenti come Claude Mythos vengono considerati potenti alleati per la ricerca di vulnerabilità e la prevenzione di attacchi informatici; dall’altro, la loro capacità di analizzare e “ragionare” su sistemi complessi solleva interrogativi sulla gestione del rischio e sul controllo delle tecnologie più avanzate.

