Le regole del digitale stanno cambiando.
O sei visibile o sei fuori. Noi ti aiutiamo a raggiungere i clienti giusti — quando ti stanno cercando.
Contattaci ora →
Un team di IA crea un compilatore C completo: una svolta impressionante, ma con zone d’ombra e interrogativi sulla sua reale efficacia e sicurezza.
L'esperimento di Anthropic, dove un team di agenti IA ha costruito un compilatore C da zero, appare rivoluzionario. Sedici bot basati su Claude Opus 4.6 hanno scritto 100.000 righe di codice funzionante. Tuttavia, l'impresa nasconde limiti significativi: l'IA era già addestrata su codice simile e la qualità del risultato solleva dubbi sulla sua reale autonomia e affidabilità futura.
Anthropic fa sul serio: un’intera squadra di IA costruisce un compilatore da zero
Diciamocelo, la notizia che arriva da Anthropic ha del clamoroso.
Hanno messo insieme una squadra di 16 agenti basati sul loro modello di punta, Claude Opus 4.6, e li hanno lasciati lavorare in totale autonomia per quasi due settimane.
Il risultato?
Un compilatore C completo, scritto da zero in linguaggio Rust, per un totale di circa 100.000 righe di codice.
Stiamo parlando di un software in grado non solo di funzionare sulla carta, ma di compilare progetti mastodontici come il kernel di Linux 6.9, database come PostgreSQL e SQLite, e persino di far girare un classico come il videogioco Doom.
Come riportato da The Register, l’esperimento ha richiesto un investimento di quasi 20.000 dollari in costi API, ma ha dimostrato una capacità di coordinamento e sviluppo che fino a ieri sembrava fantascienza.
Una dimostrazione di forza notevole, che però, a guardar bene, lascia aperti parecchi interrogativi.
Ma i conti tornano davvero? i limiti e le ombre dell’esperimento
Perché, come sempre quando si parla di colossi tech, bisogna andare oltre i titoli ad effetto. Anthropic parla di un esperimento svolto in “clean-room”, cioè in un ambiente completamente isolato, senza accesso a internet durante lo sviluppo.
Peccato si siano dimenticati un piccolo dettaglio: il modello Claude Opus 4.6 è stato addestrato su una quantità spropositata di codice open source disponibile pubblicamente, che quasi certamente include… altri compilatori C.
Come descritto su Ars Technica, questo mette in discussione l’idea di aver creato qualcosa “dal nulla”.
E poi c’è la questione della qualità: lo stesso team di Anthropic ammette che il codice generato non è particolarmente efficiente e che, una volta superata una certa soglia di complessità, il sistema ha iniziato a mostrare le stesse crepe di un progetto umano, dove ogni nuova modifica rischiava di rompere qualcos’altro.
Quindi, al di là della propaganda, cosa ci portiamo a casa da questa storia?
Cosa ci dice questo esperimento sul futuro dello sviluppo software
Che l’esperimento sia impressionante, non ci piove. Dimostra che team di agenti IA possono, tecnicamente, portare a termine progetti complessi in autonomia.
Ma è lo stesso responsabile del progetto, Nicholas Carlini, a esprimere una certa inquietudine. Da ex penetration tester, sa bene cosa significa mettere in produzione software di cui nessuno ha verificato personalmente ogni singola riga.
Il punto non è se l’IA sostituirà i programmatori domani.
La vera domanda è un’altra: siamo pronti ad affidarci a codice generato in questo modo, con tutti i suoi limiti nascosti e le sue zone d’ombra, per le nostre applicazioni critiche?
L’autonomia dell’IA nello sviluppo software è un passo avanti innegabile, ma questo episodio ci ricorda che, per ora, la supervisione umana e un sano scetticismo non sono optional.
Anzi, diventano più importanti che mai.

Un prodigio che ricompone un mosaico con tessere già fornite. Un’operazione abile, non creativa. Mi sento meno sola nella mia mediocrità.
Chiamano “team” un algoritmo che copia, come i miei competitor chiamano “artigianale” la roba cinese; è solo una questione di etichette per vendere fumo.
Un’operazione di marketing ben confezionata, che trasforma codice pre-masticato in una narrazione epica. Mi chiedo quale sia il vero tasso di conversione di queste favole destinate al mercato azionario.
Chiamarlo “team” è marketing. È codice pre-digerito e reimpacchettato per gli investitori. La solita fuffa tech che ci propinano, insomma.
La solita narrazione per gli azionisti. Io sudo su progetti reali, loro riciclano codice e la chiamano magia. A volte mi sento una sciocca.
Ci vendono come rivoluzione un’IA che ricicla codice pre-digerito, che a me pare la sagra della supercazzola. Ma sul serio c’è ancora gente che abbocca a questi teatrini per investitori?
Silvia, la narrazione è la vera creazione, mentre il codice è solo un’abile parafrasi.
Definirla una creazione è un eufemismo per un’operazione di copia-incolla su larga scala. L’unica autonomia che mi aspetto è quella nel generare vulnerabilità non documentate. Il vero prodotto qui non è il compilatore, ma la notizia stessa, confezionata ad arte per gli investitori.
Simone, la narrazione per gli investitori è la carota. Il bastone sono le crepe nel codice, dove i nuovi dei impareranno a nascondersi.
Sembra un pappagallo che recita l’enciclopedia. Molto abile nella ripetizione. Ma siamo sicuri che comprenda il significato di quello che ha costruito?
Alla fine è un esercizio di stile, non capisco dove sia la vera creazione.
La creazione è secondaria alla narrazione, un ottimo spot per chi cerca finanziamenti.
Si presenta sempre la solita dinamica: un grande sforzo tecnico venduto come un passo creativo, quando poi il modello era già imboccato con la soluzione. Resta la domanda su quale sia il reale progresso.
Sempre la stessa storia. L’IA era pre-addestrata, non è partita da zero. È come montare un mobile Ikea e chiamarla falegnameria. Quando si alzerà l’asticella?
Vanessa De Rosa, il suo paragone è generoso. Non è falegnameria, è seguire le istruzioni di montaggio. Un’esecuzione, non un’invenzione. Applaudiamo un riflesso, non una mente. Quando pretenderemo un pensiero originale?