Le regole del digitale stanno cambiando.
O sei visibile o sei fuori. Noi ti aiutiamo a raggiungere i clienti giusti — quando ti stanno cercando.
Contattaci ora →
Un team di IA crea un compilatore C completo: una svolta impressionante, ma con zone d’ombra e interrogativi sulla sua reale efficacia e sicurezza.
L'esperimento di Anthropic, dove un team di agenti IA ha costruito un compilatore C da zero, appare rivoluzionario. Sedici bot basati su Claude Opus 4.6 hanno scritto 100.000 righe di codice funzionante. Tuttavia, l'impresa nasconde limiti significativi: l'IA era già addestrata su codice simile e la qualità del risultato solleva dubbi sulla sua reale autonomia e affidabilità futura.
Anthropic fa sul serio: un’intera squadra di IA costruisce un compilatore da zero
Diciamocelo, la notizia che arriva da Anthropic ha del clamoroso.
Hanno messo insieme una squadra di 16 agenti basati sul loro modello di punta, Claude Opus 4.6, e li hanno lasciati lavorare in totale autonomia per quasi due settimane.
Il risultato?
Un compilatore C completo, scritto da zero in linguaggio Rust, per un totale di circa 100.000 righe di codice.
Stiamo parlando di un software in grado non solo di funzionare sulla carta, ma di compilare progetti mastodontici come il kernel di Linux 6.9, database come PostgreSQL e SQLite, e persino di far girare un classico come il videogioco Doom.
Come riportato da The Register, l’esperimento ha richiesto un investimento di quasi 20.000 dollari in costi API, ma ha dimostrato una capacità di coordinamento e sviluppo che fino a ieri sembrava fantascienza.
Una dimostrazione di forza notevole, che però, a guardar bene, lascia aperti parecchi interrogativi.
Ma i conti tornano davvero? i limiti e le ombre dell’esperimento
Perché, come sempre quando si parla di colossi tech, bisogna andare oltre i titoli ad effetto. Anthropic parla di un esperimento svolto in “clean-room”, cioè in un ambiente completamente isolato, senza accesso a internet durante lo sviluppo.
Peccato si siano dimenticati un piccolo dettaglio: il modello Claude Opus 4.6 è stato addestrato su una quantità spropositata di codice open source disponibile pubblicamente, che quasi certamente include… altri compilatori C.
Come descritto su Ars Technica, questo mette in discussione l’idea di aver creato qualcosa “dal nulla”.
E poi c’è la questione della qualità: lo stesso team di Anthropic ammette che il codice generato non è particolarmente efficiente e che, una volta superata una certa soglia di complessità, il sistema ha iniziato a mostrare le stesse crepe di un progetto umano, dove ogni nuova modifica rischiava di rompere qualcos’altro.
Quindi, al di là della propaganda, cosa ci portiamo a casa da questa storia?
Cosa ci dice questo esperimento sul futuro dello sviluppo software
Che l’esperimento sia impressionante, non ci piove. Dimostra che team di agenti IA possono, tecnicamente, portare a termine progetti complessi in autonomia.
Ma è lo stesso responsabile del progetto, Nicholas Carlini, a esprimere una certa inquietudine. Da ex penetration tester, sa bene cosa significa mettere in produzione software di cui nessuno ha verificato personalmente ogni singola riga.
Il punto non è se l’IA sostituirà i programmatori domani.
La vera domanda è un’altra: siamo pronti ad affidarci a codice generato in questo modo, con tutti i suoi limiti nascosti e le sue zone d’ombra, per le nostre applicazioni critiche?
L’autonomia dell’IA nello sviluppo software è un passo avanti innegabile, ma questo episodio ci ricorda che, per ora, la supervisione umana e un sano scetticismo non sono optional.
Anzi, diventano più importanti che mai.

Sembra un pappagallo che recita l’enciclopedia. Molto abile nella ripetizione. Ma siamo sicuri che comprenda il significato di quello che ha costruito?
Alla fine è un esercizio di stile, non capisco dove sia la vera creazione.
La creazione è secondaria alla narrazione, un ottimo spot per chi cerca finanziamenti.
Si presenta sempre la solita dinamica: un grande sforzo tecnico venduto come un passo creativo, quando poi il modello era già imboccato con la soluzione. Resta la domanda su quale sia il reale progresso.
Sempre la stessa storia. L’IA era pre-addestrata, non è partita da zero. È come montare un mobile Ikea e chiamarla falegnameria. Quando si alzerà l’asticella?
Vanessa De Rosa, il suo paragone è generoso. Non è falegnameria, è seguire le istruzioni di montaggio. Un’esecuzione, non un’invenzione. Applaudiamo un riflesso, non una mente. Quando pretenderemo un pensiero originale?