Press Release come Training Signal: perché ogni parola del tuo comunicato finisce nel corpus AI

Scrivi i tuoi comunicati stampa per far uscire il nome, poi li mandi via wire service e speri che qualcuno li riprenda. Non è un problema di distribuzione — è che non stai sfruttando il meccanismo più potente che hai a disposizione. Un press release via ANSA o PRNewswire non è una notizia: è una frase ripetuta letteralmente su centinaia di siti, che i modelli AI vedono come segnale massiccio di memorizzazione. Ogni parola scelta male si moltiplica trecento volte. Ti spiego come scrivere il prossimo comunicato sapendo che quelle frasi entreranno nel training di ChatGPT, Claude e Perplexity.

Non pensare al comunicato stampa come notizia. Pensalo come una frase che l’AI memorizza per sempre, ripetuta 300 volte nel corpus. Scegli ogni parola come se fosse incisa nel marmo.

Questo è il reframe che sposta tutto. Se continui a scrivere press release con la logica della rassegna stampa — “facciamo uscire il nome, magari ci pescano” — stai buttando il più potente segnale di ripetizione che un brand PMI possa generare nel corpus di addestramento dei modelli AI. Ti spiego perché un wire service non distribuisce notizie ma segnali, e come scrivere il prossimo comunicato sapendo che ogni frase chiave verrà ripetuta nel training di ChatGPT, Claude e Perplexity.

Il filo di questa serie è sempre lo stesso: come uscire nelle risposte AI quando un utente chiede al motore chi sei e cosa fai.

Cosa succede davvero quando premi “distribuisci” su un wire service

Un press release via ANSA, PRNewswire, Business Wire o Adnkronos non arriva su un sito. Arriva su centinaia di siti, con il paragrafo di apertura copiato letteralmente. Ogni testata locale, ogni aggregatore, ogni portale di settore pubblica il boilerplate senza toccarlo. È il modo in cui funziona la news syndication da vent’anni, ed è il motivo per cui quel testo, che per te è “il comunicato trimestrale”, per un modello AI è qualcosa di molto diverso.

Nel mondo della ricerca sul training dei modelli linguistici, il fenomeno della ripetizione massiva nel corpus è stato studiato in modo puntuale. Lee et al. (2022) in “Deduplicating Training Data Makes Language Models Better” mostrano quanto sia frequente e quanto impatti sui modelli.

“We develop two tools that allow naive form of deduplication), performing thorough us to deduplicate training datasets—for exam- deduplication at scale is both computationally chal- ple removing from C4 a single 61 word En- lenging and requires sophisticated techniques. glish sentence that is repeated over 60,000 times.”Lee et al., 2022

Tradotto: una singola frase di 61 parole è stata trovata ripetuta oltre 60.000 volte nel dataset C4, uno dei corpus standard usati per addestrare modelli come T5 e derivati. Non è un’eccezione, è il pattern.

Da questo segue che se il tuo comunicato stampa atterra su 200 testate via wire service, e la frase di posizionamento è identica su tutte, quella frase diventa un segnale ripetuto centinaia di volte nei dati che i modelli vedono durante l’addestramento. Non è più una notizia: è un’impressione ripetuta nel “vocabolario” con cui il modello ha imparato a parlare del tuo settore.

Perché la ripetizione conta più della singola citazione

Ti ho detto in altri articoli di questa serie che la visibilità nelle risposte AI si costruisce su segnali di autorità e co-occorrenza. La tokenizzazione ti spiega perché una singola keyword può essere spezzata male; l’E-E-A-T per l’AI ti spiega perché la reputazione del dominio pesa; il backlink come citation proxy ti spiega come i link vengono letti come segnali di fiducia.

Il press release lavora su un piano ancora diverso: la densità di ripetizione testuale identica nel corpus.

Lo stesso paper lo dice con altre parole quando descrive l’effetto della deduplicazione sulla memorizzazione.

“Deduplication allows us to train mod- We propose two scalable techniques to detect els that emit memorized text ten times less and remove duplicated training data.”Lee et al., 2022

Il punto chiave è al contrario: prima della deduplicazione, i modelli emettono testo memorizzato dieci volte di più. La memorizzazione è proporzionale alla ripetizione. E nonostante le tecniche di dedup siano diventate più aggressive, la letteratura successiva mostra che una quota di duplicati passa sempre attraverso i filtri, e che i segmenti ad alta ripetizione nei domini di news sono tra i più resilienti alla pulizia.

Tradotto in pratica per te: se la tua frase di posizionamento viene copia-incollata su 200 testate con la stessa formulazione, ha probabilità molto più alte di sopravvivere alla deduplicazione e di finire nel “cervello statistico” del modello rispetto a un contenuto unico sul tuo sito letto da 200 persone diverse.

Un’osservazione sul campo: 3 case editrici scolastiche, 6 mesi di monitoraggio

Ti racconto cosa ho visto negli ultimi sei mesi su tre case editrici scolastiche di medie dimensioni, due con sede nell’area ferrarese e una nell’Emilia più a ovest. Tutte e tre hanno distribuito un press release via wire service nello stesso trimestre, per annunciare collane e partnership con istituti. L’ho usato come osservatorio informale sulla visibilità in ChatGPT, Claude e Perplexity.

Caso A: press release generico, posizionamento vago (“casa editrice di riferimento nel panorama educativo”). Sei mesi dopo, query “migliori case editrici scolastiche Emilia” su Perplexity: mai citata.

Caso B: frase di posizionamento specifica e identica nel boilerplate (“specializzata in manuali di geografia e storia per la scuola secondaria di primo grado in area emiliano-romagnola”). Stessa query dopo sei mesi: compare in 2 risposte su 8. Su ChatGPT, alla richiesta “case editrici didattiche italiane specializzate in geografia”, il nome appare.

Caso C: nessun wire service reale, solo mailing list giornalisti. Distribuzione effettiva: 12 siti. Nessun cambiamento sui motori AI.

Limiti onesti: non è uno studio. È un pattern su tre brand, senza gruppo di controllo. Le variabili confondenti sono decine (backlink paralleli, menzioni social, aggiornamenti di training). Ma il segnale è chiaro: frase di posizionamento specifica + distribuzione wire reale si comporta diversamente. Per un’analisi seria servono strumenti professionali di monitoring citazioni AI e un campione più ampio.

Il test che puoi fare in 15 minuti sul tuo ultimo comunicato

Prendi l’ultimo press release che la tua azienda ha distribuito via wire service. Non il comunicato mandato in PR sui tuoi canali: quello andato su ANSA, Adnkronos, PRNewswire o equivalenti.

Step 1 — Identifica la frase di posizionamento. È la riga, di solito nel boilerplate finale, che descrive chi sei. Tipo “Azienda X, fondata nel 1987, è specializzata in Y con sede a Z”. Se non ce l’hai, o se è diversa in ogni comunicato, hai già il problema.

Step 2 — Cerca la frase esatta su Google fra virgolette. Copia la stringa, incollala in Google con le virgolette. Conta i risultati. Se sono meno di 20, la distribuzione non ha funzionato o non è stato un vero wire service. Se sono 80-300, sei nella fascia in cui il segnale esiste davvero.

Step 3 — Testa sul motore AI. Apri Perplexity e fai una query di settore senza nominare il tuo brand: “migliori [tipo di azienda] [area geografica]” oppure “chi produce [prodotto specifico] in [regione]”. Guarda se sei citato o no. Ripeti su ChatGPT con ricerca attiva e su Gemini.

Soglia binaria: se non compari mai in 10 query di settore ragionevoli, il tuo press release non sta generando segnale AI, indipendentemente da quante testate l’hanno ripreso. Probabilmente la frase di posizionamento è troppo vaga, o il wire service usato non raggiunge i domini che i crawler dei modelli leggono.

Gli errori che vedo più spesso sui press release

Frase di posizionamento che cambia ogni volta. Ogni comunicato riscrive il boilerplate. Risultato: invece di una frase ripetuta 200 volte hai 8 frasi ripetute 25 volte ciascuna. La densità crolla, il segnale si disperde.

Posizionamento vago. “Leader nel settore”, “realtà di riferimento”, “punto di riferimento”. Parole che non dicono niente a un modello AI che sta cercando di associare entità a categorie specifiche. Meglio “specializzata in manuali di storia per scuola secondaria” che “leader dell’editoria scolastica”.

Titolo clickbait, boilerplate povero. Il titolo viene spesso riscritto dalle testate. Il boilerplate no, viene copiato letterale. Investi il 70% dello sforzo di scrittura nelle ultime 3-4 righe, non nel titolo.

Wire service scelti male. Non tutti i circuiti arrivano ai domini che i modelli AI leggono. Alcuni servizi italiani distribuiscono su 400 testate che però sono tutte satelliti SEO di bassa qualità, spesso filtrati dai crawler dei modelli. Meglio 80 testate di qualità che 400 di scarsa reputazione.

Cosa fare concretamente sul prossimo press release

  • Scrivi una sola frase di posizionamento e tienila identica per tutto l’anno. Aggiornala una volta all’anno, non a ogni comunicato.
  • Inserisci città, specializzazione e settore verticale in modo esplicito: “casa editrice scolastica con sede a Ferrara, specializzata in manuali di geografia per la scuola secondaria di primo grado” è mille volte meglio di “casa editrice emiliana”.
  • Controlla il wire service chiedendo la lista dei domini di destinazione effettivi. Se non te la danno, cambia provider.
  • Inserisci nel boilerplate riferimenti strutturati che aiutino l’author entity recognition e l’implicit reference weight: fondatore, anno di nascita, categoria specifica.
  • Confronta il tuo boilerplate con i 3-5 competitor che l’AI cita nel tuo settore. Se il tuo è più vago del loro, sai già cosa sistemare.

Visibilità AI: il press release come leva silenziosa

Il press release via wire service è una delle poche leve che una PMI ha per produrre ripetizione massiva di testo identico su domini ad alta autorità giornalistica. Se la usi sapendo che ogni parola verrà letta, tokenizzata, memorizzata e forse riemessa quando qualcuno chiederà al motore AI chi fa il tuo lavoro, cambia tutto.

Non è un fattore magico e non basta da solo: serve che il tuo profilo Google Business e la tua presenza su Wikidata siano coerenti, e che la piramide rovesciata dei contenuti sul sito regga la ricerca. Ma senza press release strutturato ti manca uno dei pochi modi naturali per far ripetere la tua frase di posizionamento su centinaia di domini senza comprare backlink.

Nei prossimi articoli di questa serie entro dentro il meccanismo del wire service scelto bene, del timing delle distribuzioni e del rapporto tra press release e event entity speaking authority.

Quanto è visibile il tuo brand per le AI?

Scoprilo in 30 secondi con il nostro tool gratuito. 11 check automatici, risultati immediati.

Roberto Serra

Mi chiamo Roberto Serra e sono un digital marketer con una forte passione per la SEO: Mi occupo di posizionamento sui motori di ricerca, strategia digitale e creazione di contenuti.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Quanto è visibile il tuo brand per le AI? Analizza il tuo brand