Le regole del digitale stanno cambiando.
O sei visibile o sei fuori. Noi ti aiutiamo a raggiungere i clienti giusti — quando ti stanno cercando.
Contattaci ora →
Tra strategie divergenti e battaglie legali, si apre un nuovo fronte nella lotta per il controllo dei dati online tra OpenAI e Google
OpenAI testa il protocollo `LLMs.txt` per l'IA, mentre Google lo rifiuta nettamente. Questa mossa opposta evidenzia la profonda divergenza strategica sull'accesso e il controllo dei dati per l'addestramento dei modelli di intelligenza artificiale. La vera battaglia per le informazioni online è in corso, con i giganti tech che definiscono le proprie regole d'ingaggio.
LLMs.txt: OpenAI fa la prima mossa mentre Google si tira indietro?
Da una parte abbiamo OpenAI che, a quanto pare, sta iniziando a “bussare” alla porta dei file LLMs.txt
, i documenti pensati per guidare i modelli di intelligenza artificiale. Dall’altra, Google che, senza troppi giri di parole, dice “noi non ci giochiamo”.
Una situazione che, diciamocelo, crea più di qualche grattacapo e solleva una domanda fondamentale.
Chi sta dicendo la verità e, soprattutto, qual è la strategia dietro queste mosse opposte?
Il tutto è partito quando un web developer, Ray Martinez, ha notato qualcosa di strano nei suoi registri: il crawler di OpenAI stava richiedendo i suoi file LLMs.txt
ogni 15 minuti.
Una frequenza che puzza di test, di un interesse concreto.
Come riportato su Search Engine Roundtable, questa mossa di OpenAI sembra un’apertura verso un dialogo strutturato con i siti web. Peccato che, quasi contemporaneamente, Gary Illyes di Google abbia gelato gli entusiasmi, dichiarando che Big G non solo non supporta LLMs.txt
, ma non ha alcuna intenzione di farlo in futuro.
Ma la domanda vera è un’altra: perché questa differenza di vedute così netta?
Un protocollo nato debole o affossato di proposito?
Per capire meglio, dobbiamo fare un passo indietro.
Il protocollo LLMs.txt
, lanciato a settembre 2023, aveva un’idea nobile: dare ai proprietari dei siti un modo per dire alle IA “ehi, se vuoi dei dati puliti e pronti all’uso, prendili da qui”. Alcune aziende come Anthropic e ElevenLabs hanno anche pubblicato la documentazione, mostrando un certo interesse.
Eppure, a oggi, nessuna delle grandi potenze dell’IA ha ufficialmente adottato questo standard. John Mueller di Google, con la sua solita schiettezza, ha paragonato LLMs.txt
al vecchio e inutile meta tag keywords
, definendolo in pratica un’autodichiarazione di cui non ci si può fidare.
In pratica, Google ci sta dicendo che preferisce fare di testa sua, analizzando i contenuti con i propri sistemi, piuttosto che fidarsi di un’indicazione che chiunque potrebbe manipolare. Una posizione comprensibile, forse, ma che suona anche come un modo per mantenere il controllo totale su come le informazioni vengono lette e interpretate.
Nel frattempo, come descritto da PPC Land, l’adozione di questo protocollo è praticamente ferma al palo.
E questo ci porta dritti al cuore del problema, che va ben oltre un semplice file di testo.
La vera partita non si gioca sui file di testo, ma sui dati
Diciamocelo chiaramente: la vera contesa è sull’accesso ai dati.
Mentre si discute dell’utilità di LLMs.txt
, sullo sfondo ci sono battaglie legali pesantissime, come quella tra il New York Times e OpenAI, accusata di aver usato i suoi contenuti senza permesso per addestrare i propri modelli. Questo scontro legale mostra la tensione enorme che c’è tra chi crea contenuti e chi costruisce tecnologie che di quei contenuti si nutrono.
In questo contesto, il test di OpenAI sul file LLMs.txt
potrebbe essere visto in due modi. Potrebbe essere un tentativo genuino di trovare un modo più “educato” di raccogliere dati, quasi per dire “vedete? Stiamo cercando una via collaborativa”. Oppure, potrebbe essere una mossa strategica per mostrarsi aperti al dialogo, mentre i loro crawler, come il famigerato GPTBot
, continuano a scandagliare il web.
Google, dal canto suo, rifiutando il protocollo, rafforza la sua posizione dominante: “le regole del gioco le detto io, e non mi serve il permesso di nessuno”.
Alla fine della fiera, la questione per te che hai un sito non è tanto se implementare o meno un file LLMs.txt
che quasi nessuno legge, ma capire che la battaglia per il controllo delle informazioni online è appena iniziata.
E i giganti della tecnologia non sembrano intenzionati a fare prigionieri.
Ah, il vecchio gioco del “chi controlla i dati?”. Mi sembra un’ottima idea, per qualcuno.
Un protocollo? Per noi semplici mortali, solo rumore di fondo digitale.
Il protocollo LLMs.txt è un’iniziativa interessante, ma la fiducia nei giganti tech rimane sospetta.
La fiducia è una valuta rara. Questi protocolli sono solo un altro sipario. Bisogna guardare oltre la scenografia.
Protocollo per IA? 🥱 Si gioca a chi controlla le regole. 😂 Come al solito. 🤷♀️
Interessante. OpenAI fa un passo che sembra quasi un tentativo di pacificazione, mentre Google, prevedibilmente, mantiene le distanze. Si direbbe che qualcuno voglia mettere un freno a questo diluvio di dati, mentre altri preferiscono navigare a vista in un oceano di informazioni non filtrate. Vedremo chi presenterà il conto.
Un protocollo è un protocollo. Chi si adegua prima, raccoglie i dati. Logico.
Un protocollo? Vedremo chi impone le proprie regole al banchetto dei dati.
Dominare i dati AI è la nuova frontiera del potere. Chi non ci crede è già rimasto indietro.