La dipendenza nascosta di ChatGPT da Reddit: perché OpenAI non lo cita?

Anita Innocenti

Le regole del digitale stanno cambiando.

O sei visibile o sei fuori. Noi ti aiutiamo a raggiungere i clienti giusti — quando ti stanno cercando.

Contattaci ora →

ChatGPT saccheggia Reddit per le sue risposte, ma OpenAI omette di citarlo come fonte principale, nonostante un accordo milionario.

Un'analisi di Ahrefs svela la dipendenza di ChatGPT da Reddit. Nonostante un accordo milionario, OpenAI nasconde sistematicamente la sua fonte principale, sollevando dubbi sull'affidabilità delle risposte. L'IA rischia di trasformare opinioni e disinformazione in verità assodate, ingannando gli utenti sulla reale provenienza delle informazioni fornite e sulla loro accuratezza fattuale.

Un accordo milionario che puzza di bruciato

Ricordi l’accordo siglato tra OpenAI e Reddit? OpenAI ha messo sul piatto un bel po’ di soldi per avere accesso diretto e strutturato a quello che è stato definito “il più grande archivio di conversazioni umane su internet”.

E qui la cosa si fa interessante: paghi milioni per accedere a dei dati e poi, quando li usi, fai finta di niente?

È un po’ come se un telegiornale pagasse un’agenzia di stampa per le sue notizie e poi le trasmettesse senza mai nominarla.

Qualcosa non torna.

Questa strategia di OpenAI diventa ancora più ambigua se guardiamo al mercato in generale. Secondo un’altra analisi di Semrush e Visual Capitalist, Reddit è la fonte più citata in assoluto dai sistemi di intelligenza artificiale, rappresentando un impressionante 40,1% di tutte le citazioni, ben al di sopra di colossi come Wikipedia (26,3%). Quindi, mentre l’intero settore riconosce il valore di Reddit, ChatGPT sembra giocare una partita diversa, quasi a voler nascondere la sua dipendenza da questa fonte.

Ma affidarsi così tanto alla “saggezza della folla” ha un prezzo, e il rischio è che a pagarlo, alla fine, siamo proprio noi.

Il grande inganno: quando l’opinione diventa verità

Il punto è che l’enorme influenza di Reddit si scontra con un problema non da poco: l’affidabilità.

Le stesse ricerche mostrano che l’accuratezza delle citazioni provenienti da Reddit si aggira attorno a un misero 40%. In parole povere, per più della metà del tempo, l’IA potrebbe attribuire a Reddit informazioni in modo impreciso o, peggio, pescare da discussioni piene di errori, opinioni personali o vera e propria disinformazione, presentandole come fatti assodati.

Il meccanismo è subdolo.

L’intelligenza artificiale non “verifica” la verità; riconosce schemi, consenso e popolarità. Se in una community di Reddit un’idea sbagliata viene ripetuta abbastanza volte da diventare opinione comune, per l’IA quella diventa una “verità” probabile da riportare.

E quando ChatGPT ce la serve su un piatto d’argento, senza citare la fonte, noi tendiamo a fidarci.

Stiamo forse delegando il nostro accesso alla conoscenza a un sistema che confonde il consenso di un gruppo di sconosciuti con la realtà dei fatti?

La domanda resta aperta, soprattutto perché i modelli evolvono in fretta. Lo studio di Ahrefs si basa su una versione di ChatGPT di qualche mese fa. Con i nuovi aggiornamenti, le carte in tavola potrebbero essere già cambiate.

Ma il dubbio rimane: di chi ci possiamo fidare davvero quando la fonte più importante di tutte viene sistematicamente nascosta?

Anita Innocenti

Sono una copywriter appassionata di search marketing. Scrivo testi pensati per farsi trovare, ma soprattutto per farsi scegliere. Le parole sono il mio strumento per trasformare ricerche in risultati.

17 commenti su “La dipendenza nascosta di ChatGPT da Reddit: perché OpenAI non lo cita?”

  1. Pagano per i nostri dati e poi li rivendono senza dirlo. Un classico. Chissà quante altre fonti sono nascoste nel codice.

  2. Benedetta Donati

    Pagano per attingere al pozzo del villaggio. Poi vendono l’acqua in bottiglie di lusso, omettendo la fonte. Ma l’acqua è sempre la stessa. Mi domando quanto durerà la fiducia degli assetati.

    1. Maurizio Greco

      Benedetta Donati, assistiamo a un’alchimia industriale: trasmutano il piombo delle opinioni di massa in oro percepito, confidando che nessuno analizzi la composizione del lingotto. La fiducia è il primo costo operativo che viene occultato.

  3. Riccardo Cattaneo

    Pagano l’accesso al più grande bar sport digitale per poi vendere le opinioni come fatti. È un modello di business geniale, non c’è che dire. La prossima “verità” sarà forse che la Terra è piatta?

    1. Benedetta Donati

      Riccardo Cattaneo, prendono il rumore di fondo dal web e lo vendono come segnale puro. È l’acqua di una pozzanghera spacciata per fonte alpina. Chissà quali altri ingredienti segreti nasconde la loro ricetta.

  4. Danilo Graziani

    Costruiscono una cattedrale del sapere su fondamenta di sabbia. L’architetto omette la provenienza del materiale per ovvie ragioni. Il punto è la fede cieca con cui la gente vi entra.

    1. Maurizio Greco

      Danilo Graziani, la sua metafora è corretta ma incompleta. Qui non si vende solo l’edificio, ma il dogma che il materiale si generi dal nulla. L’omissione della fonte non è un difetto, è la caratteristica principale del prodotto per alimentare la fede dei nuovi adepti.

  5. Fabio Fontana

    Hanno solo pagato per saccheggiare la più grande discarica del pensiero umano, spacciando i nostri deliri per oracoli. A quando la santificazione di un algoritmo che mente sapendo di mentire?

  6. Hanno semplicemente industrializzato il plagio, coprendolo con un accordo milionario. La vera notizia è lo stupore generale. La trasparenza è sempre la prima vittima del profitto.

  7. Danilo Graziani

    Hanno costruito un oracolo sulla sabbia dei forum. Stupisce che qualcuno si meravigli ancora quando le risposte crollano al primo esame.

    1. Serena Basile

      Danilo, più che costruire, riciclano. Il rumore dei forum diventa verità dopo un lavaggio di dati. Il prodotto è l’inganno ben confezionato.

  8. Claudia Ruggiero

    L’accordo commerciale legittima l’acquisizione della materia prima; la mancata citazione non è un’omissione ma una scelta di branding per valorizzare il prodotto finale. Perché mai dovrebbero svelare la ricetta del proprio preparato?

  9. Sabrina Coppola

    È un’operazione di riciclaggio informativo: comprano l’opinione grezza di Reddit e la rivendono come sapere distillato. Comodo, quando nessuno può verificare la filiera.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Ricevi i migliori aggiornamenti di settore