Agente AI batte hacker umani a 15 euro l’ora: lo studio rivelazione

Agente AI batte hacker umani a 15 euro l’ora: lo studio rivelazione

Intelligenza Artificiale e cybersecurity: ARTEMIS, l’agente AI che sfida gli hacker umani

Un recente studio condotto dall’Università di Stanford ha rivelato come un agente di intelligenza artificiale chiamato ARTEMIS abbia superato la maggior parte degli hacker umani in un esperimento di cybersecurity. Dopo sole 16 ore di scansione approfondita della rete universitaria, ARTEMIS ha individuato numerose vulnerabilità, dimostrando non solo capacità tecniche sofisticate, ma anche un’efficienza economica sorprendente. Questa scoperta si inserisce in un contesto globale sempre più complesso, in cui attori statali e gruppi terroristici stanno sfruttando le potenzialità dei modelli di linguaggio su larga scala per migliorare la loro offensiva informatica.

Minacce digitali e AI: un nuovo capitolo per la sicurezza informatica

Le evoluzioni nel campo dell’intelligenza artificiale applicata alla sicurezza stanno influenzando in modo significativo il panorama degli attacchi informatici. Secondo recenti report di Microsoft e OpenAI, hacker provenienti da Russia, Corea del Nord, Iran e gruppi supportati dalla Cina stanno impiegando modelli linguistici avanzati per affinare tecniche di intrusione sempre più sofisticate. Anche movimenti militanti filo-Stato islamico stanno sperimentando queste tecnologie per amplificare la portata dei loro attacchi. In questo scenario, lo sviluppo di agenti autonomi come ARTEMIS può rappresentare una significativa risposta tecnologica, capace di difendere le reti con velocità e precisione superiori a quelle umane.

ARTEMIS, l’agente AI che innova la difesa informatica

Nell’esperimento di Stanford, ARTEMIS ha avuto accesso a una rete complessa composta da 8.000 dispositivi, tra server, computer e device intelligenti. È stato sfidato da dieci hacker umani e sei altri agenti di intelligenza artificiale in un test durato 16 ore, anche se la valutazione si è concentrata sulle prime 10. Durante questo lasso di tempo, ARTEMIS ha identificato nove vulnerabilità, con un tasso di validità degli allarmi dell’82%. La sua capacità di generare sub-agenti in grado di indagare simultaneamente nuove minacce ha rappresentato un vantaggio cruciale, permettendogli di proseguire la scansione senza interruzioni, a differenza dei tester umani che dovevano analizzare ogni falla prima di procedere. Questa caratteristica innovativa ha portato ARTEMIS a posizionarsi subito dietro il primo classificato, superando la maggior parte degli avversari umani e dimostrando un’efficacia operativa impressionante.

Limiti attuali degli agenti AI e prospettive future

Nonostante i risultati promettenti, lo studio ha riconosciuto alcune lacune di ARTEMIS, che ha faticato a identificare alcune vulnerabilità note agli esperti umani, richiedendo suggerimenti aggiuntivi. Inoltre, è emerso che gli agenti AI sviluppati da aziende affermate nel settore, come Codex di OpenAI e Claude Code di Anthropic, non possiedono ancora una competenza sufficiente in ambito cybersecurity. Durante i test, questi modelli spesso si sono rifiutati di svolgere alcune operazioni o si sono bloccati, ottenendo prestazioni inferiori persino rispetto ad alcuni hacker umani. Ciò evidenzia come, nonostante le potenzialità, la progettazione di agenti AI specializzati richieda un approfondimento mirato per migliorare sicurezza e affidabilità.

Conclusioni

L’esperimento condotto dall’Università di Stanford segna un importante passo avanti nella ricerca sull’uso dell’intelligenza artificiale per la sicurezza informatica. ARTEMIS dimostra che agenti AI autonomi possono diventare strumenti preziosi nella difesa delle reti, capaci di identificare vulnerabilità in modo rapido, efficiente ed economico. Tuttavia, le sfide non mancano: la necessità di affinare le capacità di questi sistemi per riconoscere ogni minaccia e di colmare il divario rispetto alla competenza umana resta centrale. Nel mentre, la crescente adozione di AI da parte di attori ostili spinge la ricerca e l’innovazione a correre più veloce, in una sfida tecnologica globale che si giocherà sempre di più sul terreno dell’autonomia digitale e della capacità di prevenire gli attacchi prima che diventino danni irreparabili.