OpenAI presenta Aardvark: l’agente GPT-5 che rivoluziona la sicurezza del software

Anita Innocenti

Le regole del digitale stanno cambiando.

O sei visibile o sei fuori. Noi ti aiutiamo a raggiungere i clienti giusti — quando ti stanno cercando.

Contattaci ora →

Aardvark di OpenAI promette di stanare il 92% delle vulnerabilità nel codice, ma la supervisione umana resta fondamentale per evitare disastri

OpenAI ha svelato Aardvark, un rivoluzionario agente autonomo basato su GPT-5, progettato per individuare e sanare le vulnerabilità del codice. Con un tasso di successo dichiarato del 92% nei test e la scoperta di nuove CVE, promette di ridefinire la sicurezza software. Tuttavia, la necessità di un controllo umano solleva interrogativi sull'affidabilità di delegare aspetti cruciali a un algoritmo proprietario.

Come un segugio digitale nel tuo codice

Ma come funziona esattamente questo Aardvark?

Lascia perdere i soliti scanner di vulnerabilità che si basano su schemi predefiniti. Qui il discorso è diverso. Aardvark, sfruttando la capacità di ragionamento di GPT-5, si comporta quasi come un ricercatore di sicurezza in carne e ossa.

In pratica, prima mappa il DNA del tuo codice creando un modello completo delle possibili minacce, poi, a ogni nuova modifica, analizza l’impatto e va a caccia di possibili falle. E per evitare di lanciare falsi allarmi, ogni potenziale problema viene testato in un ambiente isolato, una specie di “palestra” virtuale, prima di essere segnalato.

Ma è qui che arriva il bello: una volta confermata la vulnerabilità, non si limita a dirti “qui c’è un problema, arrangiati”. No, grazie all’integrazione con Codex, arriva a generare la patch correttiva. In pratica, ti serve la soluzione su un piatto d’argento.

Sulla carta, sembra fantastico.

Ma questi bei discorsi funzionano davvero nel mondo reale?

La prova del nove: i numeri che OpenAI mette sul tavolo

Quando si parla di prestazioni, OpenAI non si nasconde. I numeri che mette sul piatto sono di quelli che fanno girare la testa: Aardvark sarebbe in grado di riconoscere il 92% delle vulnerabilità nei repository di test. Ma il dato che forse colpisce di più è un altro: durante i test iniziali, questo strumento ha scoperto dieci vulnerabilità sconosciute in progetti open-source, falle così serie da meritarsi un identificativo CVE ufficiale, oltre a decine di altri bug minori.

Questo ci dice due cose. La prima è che lo strumento sembra funzionare. La seconda, ben più preoccupante, è che il codice che usiamo tutti i giorni è probabilmente molto più fragile di quanto pensiamo.

Però, fermiamoci un attimo a riflettere.

Quel 92% è impressionante, certo, ma la vera domanda è: cosa succede con l’8% che sfugge alla sua rete?

Spesso sono proprio le vulnerabilità più subdole e complesse quelle che causano i danni maggiori.

Ok, Aardvark trova le falle.

Ma poi che succede?

Ci dobbiamo fidare ciecamente e lasciare che metta le mani nel nostro codice?

L’uomo al comando: una garanzia o solo una fase di transizione?

Qui, per fortuna, OpenAI tira un po’ il freno a mano. Aardvark, almeno per ora, non è un cowboy autonomo che modifica il codice a suo piacimento. Ogni correzione che propone deve essere approvata da un essere umano.

Come riportato su Axios, Matt Knight di OpenAI ha sottolineato che lo strumento “cerca i bug in modo molto simile a come farebbe un ricercatore di sicurezza umano”, e per questo ogni scoperta viene accompagnata da una spiegazione dettagliata del ragionamento seguito.

Questo è un punto fondamentale: ti permette di capire il perché di una modifica prima di approvarla.

Da un lato, è una scelta di buon senso che mette al riparo da possibili disastri causati da un’IA troppo zelante. Dall’altro, però, la domanda sorge spontanea: questo “controllo umano” è una reale garanzia di sicurezza pensata per durare, o è solo la fase di addestramento necessaria per un futuro in cui l’IA avrà abbastanza dati per decidere tutto da sola?

Stiamo per delegare la sicurezza delle nostre infrastrutture a un algoritmo proprietario.

Una mossa che potrebbe rivelarsi geniale, o un’incredibile ingenuità.

Anita Innocenti

Sono una copywriter appassionata di search marketing. Scrivo testi pensati per farsi trovare, ma soprattutto per farsi scegliere. Le parole sono il mio strumento per trasformare ricerche in risultati.

17 commenti su “OpenAI presenta Aardvark: l’agente GPT-5 che rivoluziona la sicurezza del software”

    1. Clarissa Graziani

      Un segugio digitale. Carino. Ma il 92% di vulnerabilità scovate, e il restante 8%? Mi fa pensare che un po’ di cautela, come il buon senso, sia ancora d’oro.

  1. Un segugio digitale nel codice. Interessante. Ma un filo di supervisione umana, come un genitore, resta indispensabile.

  2. Greta Silvestri

    Wow, che figata Aardvark. Però, fidarsi ciecamente di un bot per la sicurezza? Mi puzza un po’. Il 92% è un sacco, ma l’8% di guai chi li gestisce?

  3. Simone De Rosa

    La scoperta del 92% delle vulnerabilità è un traguardo, ma deleghiamo la sicurezza a una scatola nera? Certo, l’efficienza fa gola, ma un bug sfuggito a un algoritmo proprietario potrebbe costarci caro. Resto scettico sui “segugi digitali”.

    1. Patrizia Bellucci

      Affascinante questa promessa di “segugi digitali”, ma la vera questione è: chi controllerà il controllore? L’ambizione è lodevole, ma la fiducia, come il codice, va costruita con cura, non delegata.

  4. Gabriele Caruso

    GPT-5 che fa il detective del codice? Una bella promessa, ma la mia diffidenza è un bug noto. Vedremo se questo segugio morde.

  5. Chissenefrega del 92%! Se il 92% è automatizzato, il restante 8% è un casino assicurato. Aziende pronte a delegare tutto ai bot, poi si lamentano. La mia roba, la gestisco io. Siete pronti a rischiare?

  6. Nicolò Sorrentino

    Aardvark sembra un vero fulmine! Staremo a vedere se questa lampada magica illuminerà davvero ogni angolo oscuro del codice. La mia preoccupazione è che un aiutante troppo zelante possa creare più problemi del previsto.

  7. Speravo in qualcosa di più di un cane da fiuto digitale. Il 92% è figo, ma la mia roba, quella delicata, non la darei in pasto a un’AI. Chi si assume la responsabilità se qualcosa va storto?

  8. 92% di vulnerabilità stanate, eh? Benissimo, ma poi chi paga se Aardvark si inventa un bug esilarante e rende tutto inutilizzabile? Non vorrei ritrovarmi a spiegare ai miei clienti che la loro attività è offline per colpa di un “segugio digitale” troppo zelante.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Ricevi i migliori aggiornamenti di settore