Le regole del digitale stanno cambiando.
O sei visibile o sei fuori. Noi ti aiutiamo a raggiungere i clienti giusti — quando ti stanno cercando.
Contattaci ora →
Dietro al file “LLMs.txt” si nasconderebbe un aggiornamento del sistema di gestione dei contenuti di Google, ma la spiegazione ufficiale non convince del tutto.
La comparsa di un misterioso file `LLMs.txt` sui siti di Google ha acceso il dibattito. Mentre molti ipotizzavano un nuovo standard per l'addestramento delle IA, la spiegazione ufficiale di John Mueller, che parla di "altri scopi", appare volutamente vaga e poco convincente. Questa mancanza di trasparenza solleva dubbi sulle reali strategie del colosso tecnologico nel controllo dei dati.
Un file misterioso spunta sui siti di Google
Da qualche tempo, sui siti per sviluppatori di Google, ha iniziato a fare capolino un file un po’ strano: LLMs.txt.
Appena la notizia si è diffusa, molti hanno subito pensato: ecco il nuovo standard, un modo chiaro e pulito per indicare alle intelligenze artificiali dove pescare dati per il loro addestramento.
Una mossa logica, no?
In un mondo in cui le IA sono affamate di informazioni, creare un sistema per guidarle sembrava un passo quasi ovvio. Peccato che la realtà, come spesso accade quando si parla dei colossi della tecnologia, sia un po’ meno trasparente.
La comparsa di questi file, infatti, non è stata una scelta strategica comunicata al mondo, ma qualcosa di ben diverso.
La spiegazione ufficiale che non spiega nulla
A gettare acqua sul fuoco, o forse a confondere ancora di più le idee, ci ha pensato John Mueller di Google su BlueSky. Il buon Mueller ha dichiarato che questi file servono ad “altri scopi” e sono stati posizionati di proposito in modo da non essere trovati facilmente, perché non sono pensati per la scoperta da parte dei modelli linguistici.
La cosa ancora più curiosa è che la loro comparsa sarebbe il risultato di un aggiornamento del sistema di gestione dei contenuti esteso a tutti i siti, avvenuto senza che i singoli team ne fossero pienamente consapevoli.
Diciamocelo, una risposta che dice tutto e niente.
Un’azienda come Google, che vive di organizzazione e processi, fa un aggiornamento così capillare e inserisce file dal nome così evocativo per “altri scopi” non meglio specificati?
È una versione dei fatti che lascia un po’ perplessi, soprattutto considerando quanto sia delicato oggi il tema dell’addestramento delle IA.
E questa mancanza di chiarezza apre le porte a domande ben più grandi, che vanno oltre un semplice file di testo.
Cosa c’è davvero dietro questa mossa?
Questa vicenda non è solo una nota a piè di pagina per addetti ai lavori. È un piccolo segnale di una partita molto più grande che si sta giocando sul controllo dell’informazione e delle tecnologie di intelligenza artificiale.
La spiegazione di Mueller, pur chiudendo la porta all’ipotesi di un nuovo standard palese, ne lascia aperte molte altre.
Che questi file servano a scopi interni di catalogazione non pubblici?
O forse a testare protocolli futuri lontano da occhi indiscreti, per poi introdurli quando saranno pronti?
La verità è che la corsa ai dati per addestrare le IA è in pieno svolgimento e ogni mossa dei giganti come Google viene scrutata con attenzione.
Una spiegazione così vaga su un’azione così visibile non fa che alimentare il sospetto che le decisioni importanti vengano prese a porte chiuse, lasciando la comunità all’oscuro.
Alla fine, la questione rimane aperta: mentre Google riorganizza il suo immenso archivio di conoscenza, non è per niente chiaro a chi stia davvero aprendo le porte e a chi, invece, le stia silenziosamente chiudendo.

Non siamo mattoni per progetti segreti. La fiducia richiede sempre grande trasparenza.
@Renato Graziani La fiducia è un concetto obsoleto per chi non vende prodotti ma utenti.
@Emanuele Barbieri Appunto. Tante chiacchiere e giri di parole, ma la sostanza non cambia.
@Renato Graziani “Altri scopi” è il modo elegante per non dire nulla di concreto. Alla fine, i dati li usano come pare a loro.
Siamo la cava, i mattoni, il terreno. Loro costruiscono senza mostrarci il progetto. Un altro velo di nebbia per nascondere il castello che edificano con i nostri dati. Che stanchezza.
La solita storia: ci usano come mattoni per i loro muri senza chiedere il permesso.
La sorpresa per la mancanza di trasparenza di Google è quasi commovente. Hanno costruito un impero sul controllo dei dati e ora ci stupiamo se mettono un nuovo lucchetto alla porta? L’unica reazione sensata è costruire la propria fortezza, non lamentarsi di quella altrui.
Chiamare “mistero” una banale operazione di recinzione del proprio dataset di addestramento è un’esagerazione giornalistica. Dati puliti e proprietari sono un vantaggio competitivo. Mi chiedo solo quanto valga questo “recinto” sul loro bilancio, visto che lo costruiamo noi gratuitamente.
Elisa Marchetti, noi utenti siamo i muratori di un recinto che non possiamo varcare.
Francesco De Angelis, più che muratori, siamo la cava da cui estraggono i mattoni gratis. E li ringraziamo pure per il disturbo. La vera genialata, alla fine, è proprio questa loro.
Elisa Marchetti, il valore? Il monopolio. Noi forniamo i mattoni per il loro muro.
Limitare l’accesso ai dati è un modo per garantire qualità, ma chissà se il vero obiettivo non sia creare un club molto esclusivo.
Claudia Ruggiero, “club esclusivo” è un eufemismo per monopolio. La qualità è solo un pretesto per recintare la miniera d’oro, lasciando a noi le briciole.
Chiamano recinto la loro miniera di dati. Noi siamo i canarini, evidentemente.
Lo chiamano recinto, io lo chiamo data quality control. Mica male.
La comica spiegazione di “altri scopi” per un file chiamato LLMs.txt è la solita cortina di fumo. Si stanno semplicemente costruendo il loro giardino privato per i dati, dove solo loro dettano le regole del gioco. Quando ci sveglieremo sarà già troppo tardi.
La spiegazione di Google è un velo di nebbia gettato sul porto: si vede che una nave sta attraccando, ma nessuno sa cosa stia scaricando. È ammirevole la loro convinzione che il pubblico creda ancora alle favole con questa disinvoltura.
Renato, non è nebbia, è il recinto che costruiscono per dettare le regole del gioco.