Le regole del digitale stanno cambiando.
O sei visibile o sei fuori. Noi ti aiutiamo a raggiungere i clienti giusti — quando ti stanno cercando.
Contattaci ora →
La piattaforma, ricca di quasi due decenni di discussioni umane, si posiziona come una miniera di dati essenziale per addestrare le IA e, per questo, intende ora monetizzare l’accesso ai suoi contenuti.
Il CEO di Reddit, Steve Huffman, definisce i dati degli utenti il "petrolio" delle moderne IA. Con una nuova policy, la piattaforma blocca l'accesso gratuito e introduce licenze a pagamento per le aziende che addestrano modelli di intelligenza artificiale. Una mossa strategica che solleva interrogativi cruciali su chi possiede e può monetizzare i contenuti generati online.
Reddit come miniera di dati per l’intelligenza artificiale
Secondo Huffman, il punto è semplice: i modelli linguistici imparano a parlare, ragionare e risolvere problemi analizzando come lo facciamo noi esseri umani.
E dove trovano discussioni lunghe, articolate e autentiche su larga scala?
Non certo sui social basati su video brevi e immagini, ma su piattaforme come Reddit.
Il CEO sostiene che senza questo immenso patrimonio di conversazioni, le IA sarebbero meno utili, meno sfumate e molto più distanti dal nostro modo di esprimerci. È per questo che definisce i contenuti di Reddit il “petrolio moderno”: una risorsa grezza, scarsa e di valore, che aziende esterne stanno usando per costruire i loro prodotti commerciali.
Dietro questa rivendicazione, però, si nasconde una strategia ben precisa che sta cambiando le regole del gioco per chiunque acceda ai dati della piattaforma.
La grande svolta: da piattaforma aperta a fornitore a pagamento
Fino a poco tempo fa, Reddit permetteva un accesso piuttosto libero ai suoi contenuti, pur vietandone tecnicamente l’uso commerciale. Una regola facile da aggirare, soprattutto da quando i laboratori di IA hanno iniziato a “raschiare” il web su scala industriale.
Ora, Huffman ha deciso di mettere ordine, ma a modo suo, introducendo una Public Content Policy che regola l’accesso ai dati.
L’idea è di concedere l’uso dei dati ad aziende partner, come quelle che sviluppano IA, ma a condizioni ben precise: è vietato provare a de-anonimizzare gli utenti, usare i dati per profilazione pubblicitaria e bisogna rispettare la cancellazione dei contenuti.
L’accesso per la ricerca accademica resta gratuito, ma per l’uso commerciale, specialmente per addestrare modelli di IA, ora si paga.
Belle promesse, sulla carta.
Ma la domanda sorge spontanea: queste restrizioni sono davvero applicabili una volta che i dati sono stati “digeriti” e sono diventati parte integrante di un modello di intelligenza artificiale?
La questione, in realtà, è solo la punta di un iceberg molto più grande.
La vera partita: a chi appartiene il web?
La mossa di Huffman si inserisce in un dibattito globale infuocato:
Chi deve pagare per i dati che addestrano le IA?
Da una parte ci sono i colossi tech che hanno costruito i loro modelli “saccheggiando” dati pubblici dal web, sostenendo che sia un po’ come un essere umano che impara leggendo libri in biblioteca. Dall’altra, ci sono editori, artisti e autori che li accusano di aver usato materiale protetto da copyright senza permesso, dando il via a una serie di cause legali, come quella del New York Times contro OpenAI e Microsoft.
In questo scontro tra titani, Reddit si posiziona in modo furbo: la maggior parte dei suoi contenuti non è giornalismo professionale, ma è generata dagli utenti e soggetta ai termini di servizio della piattaforma, che non hanno mai autorizzato un riutilizzo commerciale.
In pratica, Reddit sta dicendo al mercato: i nostri dati sono di alta qualità, sono strutturati e, soprattutto, non sono gratis.
Una presa di posizione che costringe tutti, dalle big tech agli utenti, a chiedersi chi stia davvero catturando il valore creato da milioni di persone che, ogni giorno, condividono online un pezzetto della loro vita.
