Le regole del digitale stanno cambiando.

O sei visibile o sei fuori. Noi ti aiutiamo a raggiungere i clienti giusti — quando ti stanno cercando.

Aardvark di OpenAI promette di stanare il 92% delle vulnerabilità nel codice, ma la supervisione umana resta fondamentale per evitare disastri

OpenAI ha svelato Aardvark, un rivoluzionario agente autonomo basato su GPT-5, progettato per individuare e sanare le vulnerabilità del codice. Con un tasso di successo dichiarato del 92% nei test e la scoperta di nuove CVE, promette di ridefinire la sicurezza software. Tuttavia, la necessità di un controllo umano solleva interrogativi sull'affidabilità di delegare aspetti cruciali a un algoritmo proprietario.

Come un segugio digitale nel tuo codice

Ma come funziona esattamente questo Aardvark?

Lascia perdere i soliti scanner di vulnerabilità che si basano su schemi predefiniti. Qui il discorso è diverso. Aardvark, sfruttando la capacità di ragionamento di GPT-5, si comporta quasi come un ricercatore di sicurezza in carne e ossa.

In pratica, prima mappa il DNA del tuo codice creando un modello completo delle possibili minacce, poi, a ogni nuova modifica, analizza l’impatto e va a caccia di possibili falle. E per evitare di lanciare falsi allarmi, ogni potenziale problema viene testato in un ambiente isolato, una specie di “palestra” virtuale, prima di essere segnalato.

Ma è qui che arriva il bello: una volta confermata la vulnerabilità, non si limita a dirti “qui c’è un problema, arrangiati”. No, grazie all’integrazione con Codex, arriva a generare la patch correttiva. In pratica, ti serve la soluzione su un piatto d’argento.

Sulla carta, sembra fantastico.

Ma questi bei discorsi funzionano davvero nel mondo reale?

La prova del nove: i numeri che OpenAI mette sul tavolo

Quando si parla di prestazioni, OpenAI non si nasconde. I numeri che mette sul piatto sono di quelli che fanno girare la testa: Aardvark sarebbe in grado di riconoscere il 92% delle vulnerabilità nei repository di test. Ma il dato che forse colpisce di più è un altro: durante i test iniziali, questo strumento ha scoperto dieci vulnerabilità sconosciute in progetti open-source, falle così serie da meritarsi un identificativo CVE ufficiale, oltre a decine di altri bug minori.

Questo ci dice due cose. La prima è che lo strumento sembra funzionare. La seconda, ben più preoccupante, è che il codice che usiamo tutti i giorni è probabilmente molto più fragile di quanto pensiamo.

Però, fermiamoci un attimo a riflettere.

Quel 92% è impressionante, certo, ma la vera domanda è: cosa succede con l’8% che sfugge alla sua rete?

Spesso sono proprio le vulnerabilità più subdole e complesse quelle che causano i danni maggiori.

Ok, Aardvark trova le falle.

Ma poi che succede?

Ci dobbiamo fidare ciecamente e lasciare che metta le mani nel nostro codice?

L’uomo al comando: una garanzia o solo una fase di transizione?

Qui, per fortuna, OpenAI tira un po’ il freno a mano. Aardvark, almeno per ora, non è un cowboy autonomo che modifica il codice a suo piacimento. Ogni correzione che propone deve essere approvata da un essere umano.

Come riportato su Axios, Matt Knight di OpenAI ha sottolineato che lo strumento “cerca i bug in modo molto simile a come farebbe un ricercatore di sicurezza umano”, e per questo ogni scoperta viene accompagnata da una spiegazione dettagliata del ragionamento seguito.

Questo è un punto fondamentale: ti permette di capire il perché di una modifica prima di approvarla.

Da un lato, è una scelta di buon senso che mette al riparo da possibili disastri causati da un’IA troppo zelante. Dall’altro, però, la domanda sorge spontanea: questo “controllo umano” è una reale garanzia di sicurezza pensata per durare, o è solo la fase di addestramento necessaria per un futuro in cui l’IA avrà abbastanza dati per decidere tutto da sola?

Stiamo per delegare la sicurezza delle nostre infrastrutture a un algoritmo proprietario.

Una mossa che potrebbe rivelarsi geniale, o un’incredibile ingenuità.

Paolo Fiore

3 Novembre 2025 alle 18:42

Questo Aardvark sembra un passo avanti, ma ho un certo timore.

Saremo mai sicuri delegando la sicurezza a un algoritmo?

Rispondi

Clarissa Graziani
3 Novembre 2025 alle 19:18

Un segugio digitale. Carino. Ma il 92% di vulnerabilità scovate, e il restante 8%? Mi fa pensare che un po’ di cautela, come il buon senso, sia ancora d’oro.

Rispondi

Enrico Negri

3 Novembre 2025 alle 13:44

Un segugio digitale nel codice. Interessante. Ma un filo di supervisione umana, come un genitore, resta indispensabile.

Luciano Fiore
3 Novembre 2025 alle 14:19

Aardvark, eh? 92% di bug scovati. Bene. Il resto chi lo gestisce? Il mio scetticismo tecnologico ringrazia.

Rispondi

Greta Silvestri

2 Novembre 2025 alle 11:48

Wow, che figata Aardvark. Però, fidarsi ciecamente di un bot per la sicurezza? Mi puzza un po’. Il 92% è un sacco, ma l’8% di guai chi li gestisce?

Giovanni Graziani

2 Novembre 2025 alle 11:24

Aardvark, un altro trucchetto tech. Il 92%? Ridicolo. Resta l’8% di disastri, giusto? Chi paga i danni?

Giada Mariani

2 Novembre 2025 alle 4:56

Aardvark, un cane da tartufi digitale? Benissimo. Ma il resto dell’8% resta un buco nero.

Massimo Martino
2 Novembre 2025 alle 5:30

Intelligenza artificiale che scova bug? Meglio averla sotto chiave. Chi controlla il controllore?

Rispondi

Simone De Rosa

2 Novembre 2025 alle 1:56

La scoperta del 92% delle vulnerabilità è un traguardo, ma deleghiamo la sicurezza a una scatola nera? Certo, l’efficienza fa gola, ma un bug sfuggito a un algoritmo proprietario potrebbe costarci caro. Resto scettico sui “segugi digitali”.

Patrizia Bellucci
2 Novembre 2025 alle 2:33

Affascinante questa promessa di “segugi digitali”, ma la vera questione è: chi controllerà il controllore? L’ambizione è lodevole, ma la fiducia, come il codice, va costruita con cura, non delegata.

Rispondi

Gabriele Caruso

1 Novembre 2025 alle 18:01

GPT-5 che fa il detective del codice? Una bella promessa, ma la mia diffidenza è un bug noto. Vedremo se questo segugio morde.

Simone Rinaldi
1 Novembre 2025 alle 19:16

Gabriele, la diffidenza è un buon punto di partenza. Il 92% è alto, ma il 100% è la vera sfida, no?

Rispondi
Nicolò Sorrentino
1 Novembre 2025 alle 18:36

Gabriele, il tuo segugio digitale morde, ma vogliamo la certezza. Controllo umano, un salvagente.

Rispondi

Simone Damico

1 Novembre 2025 alle 10:57

Chissenefrega del 92%! Se il 92% è automatizzato, il restante 8% è un casino assicurato. Aziende pronte a delegare tutto ai bot, poi si lamentano. La mia roba, la gestisco io. Siete pronti a rischiare?

Nicolò Sorrentino

1 Novembre 2025 alle 1:40

Aardvark sembra un vero fulmine! Staremo a vedere se questa lampada magica illuminerà davvero ogni angolo oscuro del codice. La mia preoccupazione è che un aiutante troppo zelante possa creare più problemi del previsto.

Elena Negri

1 Novembre 2025 alle 1:19

Speravo in qualcosa di più di un cane da fiuto digitale. Il 92% è figo, ma la mia roba, quella delicata, non la darei in pasto a un’AI. Chi si assume la responsabilità se qualcosa va storto?

Melissa Negri

31 Ottobre 2025 alle 9:43

92% di vulnerabilità stanate, eh? Benissimo, ma poi chi paga se Aardvark si inventa un bug esilarante e rende tutto inutilizzabile? Non vorrei ritrovarmi a spiegare ai miei clienti che la loro attività è offline per colpa di un “segugio digitale” troppo zelante.

OpenAI presenta Aardvark: l’agente GPT-5 che rivoluziona la sicurezza del software

Aardvark di OpenAI promette di stanare il 92% delle vulnerabilità nel codice, ma la supervisione umana resta fondamentale per evitare disastri

Come un segugio digitale nel tuo codice

La prova del nove: i numeri che OpenAI mette sul tavolo

L’uomo al comando: una garanzia o solo una fase di transizione?

17 commenti su “OpenAI presenta Aardvark: l’agente GPT-5 che rivoluziona la sicurezza del software”

Lascia un commento Annulla risposta

Mercato, richieste e concorrenti. Scopri le potenzialità del tuo Business su Google. Dati alla mano.

Analisi di fattibilità