Esistere come entità, non come pagina

Quando l’AI non capisce più che “noi” sei tu: il problema della coreference

Roberto Serra 14 Aprile 2026·~9 min di lettura

Se i tuoi testi usano "noi", "la nostra struttura", "il servizio" invece del nome del brand, l'AI perde il filo tra le tue affermazioni migliori e il tuo nome. Più la pagina è lunga, più aumenta il rischio: stai costruendo autorità che non si aggancia a te. La correzione è chirurgica, si fa sui testi che hai già — e riporta ogni merito dove deve stare.

Ricordo quando Google, tra il 2013 e il 2015, iniziò davvero a capire i pronomi. Prima, se scrivevi “Villa San Marco è un boutique hotel a Venezia. Offre camere affacciate sulla laguna”, per il motore di ricerca quel “offre” era quasi sospeso nel vuoto. La parola chiave era “Villa San Marco”, punto. Tutto quello che stava nelle frasi successive, se non ripetevi il nome, diventava testo decorativo.

Poi arrivò Hummingbird, poi BERT, e Google imparò a collegare i pronomi ai loro soggetti. L’AI oggi fa la stessa cosa, ma a un livello molto più spinto: quando ChatGPT o Perplexity leggono la pagina del tuo boutique hotel, devono capire che “l’hotel”, “la struttura”, “il nostro servizio”, “loro”, “noi” sono tutti riferimenti alla stessa entità, cioè il tuo brand.

Se il collegamento si rompe, le affermazioni migliori che fai su di te (camere affacciate sul Canal Grande, colazione con prodotti del mercato di Rialto, concierge multilingua) non vengono associate al tuo nome. E quando un utente chiede “qual è un buon boutique hotel affacciato sulla laguna a Venezia”, il sistema non ti cita.

Questo problema tecnico ha un nome preciso: coreference resolution. In questo articolo ti spiego cos’è, perché sta a monte di tutto il lavoro di entity optimization, e cosa puoi cambiare nei tuoi testi stasera per non disperdere segnale.

Cosa vede davvero un modello quando legge “noi”

Nel mondo della ricerca sull’NLP, la coreference resolution è il compito di identificare quando due o più espressioni in un testo si riferiscono alla stessa entità del mondo reale. “Villa San Marco”, “l’hotel”, “la nostra struttura”, “noi”, “loro” possono puntare tutti allo stesso soggetto, oppure a soggetti diversi: dipende dal contesto, dall’ordine delle frasi, dalla distanza tra il pronome e l’ultimo nome proprio.

Liu et al. (2025), nel paper Enhancing Coreference Resolution with Pretrained LMs, documentano che i modelli linguistici grandi stile GPT-3 e PaLM hanno fatto passi enormi sui compiti di few-shot learning, ma che la gestione del contesto esteso e la risoluzione dei riferimenti in testi lunghi restano punti critici. Il paper cita esplicitamente framework come LQCA (Long Question Coreference Adaptation) nati per gestire i riferimenti in documenti estesi, perché il problema non è risolto.

Tradotto in pratica per te che gestisci un boutique hotel a Venezia: quando la pagina “Chi siamo” del tuo sito è lunga 1.200 parole e contiene il nome della struttura solo nel primo paragrafo, il modello AI che la legge deve tenere agganciato quel nome a tutti i “noi” e “la struttura” che seguono. Più il testo è lungo, più quel filo si tende e rischia di spezzarsi.

La conseguenza operativa è semplice: la qualità delle tue affermazioni conta meno se il collegamento al tuo brand name si perde per strada.

Perché la coreference sta a monte di tutto il resto del lavoro entity

Negli articoli precedenti di questa serie ti ho parlato di Named Entity Recognition, di Entity Disambiguation e di Entity Salience. Tutti meccanismi che partono da un presupposto implicito: che il modello AI riesca ad agganciare ogni frase del tuo testo alla giusta entità.

La coreference resolution è proprio quell’aggancio. È il lavoro invisibile che il modello fa prima di decidere se tu sei un’entità rilevante, prima di disambiguare “Villa San Marco” rispetto ad altre venti ville con lo stesso nome, prima di assegnarti un salience score alto o basso.

Se scrivi venti frasi tutte con “la nostra struttura offre…” e “noi proponiamo…”, il modello ha due opzioni: aggancia tutto al brand name menzionato una sola volta a inizio pagina (filo lungo, fragile), oppure tratta quelle affermazioni come sospese, attribuite a un soggetto generico “boutique hotel di Venezia”.

La seconda opzione è un disastro per la visibilità nelle risposte AI. Perché quando un utente chiede a Perplexity “qual è un boutique hotel a Venezia con vista sulla laguna dal terrazzo”, il sistema sta cercando affermazioni associate a entità specifiche, non a soggetti generici. Se il tuo “noi abbiamo un terrazzo affacciato sulla laguna nord” non è agganciato al tuo brand name, non conta come tuo.

Questo problema si collega in linea diretta anche al lavoro sulla rappresentazione vettoriale dei contenuti: l’embedding di una frase con riferimento coreferenziale spezzato pesa meno nel grounding della risposta.

Siamo abituati a pensare alla ricerca in termini lineari: “se faccio X, ottengo Y”. I modelli di intelligenza artificiale operano in uno spazio vettoriale, dove le relazioni sono multidimensionali e in costante evoluzione.
Cercare di applicare la vecchia logica SEO a quel mondo non funziona.

E sì, i sistemi sono opachi. Ma lo era anche Google nel 1998. Abbiamo imparato, ci siamo adattati e abbiamo costruito intere carriere partendo da quell’opacità. Non c’è alcuna differenza.

Inoltre, siamo onesti… il web non è mai stato una meritocrazia. È sempre stata la sopravvivenza del più forte. Vince chi si adatta più rapidamente. E se ci pensate, anche il concetto di meritocrazia implica competizione. Un vincitore, molti perdenti. Il web ha sempre seguito queste regole.
Duane Forrester, AI Search strategist, su SEO Confidential

Errore comune

Brand name solo nell’H1 e nel footer: tutto il body scorre in prima persona plurale.

L’errore che vedo più spesso nei siti dell’hospitality

Nel mondo del turismo italiano, soprattutto nei boutique hotel di charme di città d’arte come Venezia, c’è un pattern che si ripete in modo quasi identico: la pagina “Chi siamo” e la pagina “la nostra filosofia” sono scritte in prima persona plurale, calda, evocativa, e il brand name compare due o tre volte in tutto il testo, quasi sempre come firma finale.

Il risultato, dal punto di vista di un modello AI che deve estrarre entità e affermazioni:

“Siamo una famiglia veneziana che da tre generazioni accoglie viaggiatori”: soggetto “noi” sospeso, non agganciato.
“La nostra colazione si fa con prodotti del mercato di Rialto”: “nostra” deve risalire al brand name, che è due paragrafi sopra.
“Offriamo tour privati in gondola al tramonto”: stesso problema, e qui si perde un’affermazione molto specifica, potenzialmente citabile dall’AI quando un utente chiede “hotel a Venezia con esperienze sulla laguna”.

Per un modello di linguaggio, questa pagina è un nastro di affermazioni belle ma mal attribuite. Il filo tra il brand name e le caratteristiche distintive della struttura è troppo lungo, e si spezza.

Pro tip

Per le pagine servizi, apri con una frase tipo “[Brand name] + [servizio specifico]”: “Villa San Marco propone un ristorante affacciato sulla laguna”, non “Il nostro ristorante è affacciato sulla laguna”.

Cosa cambia se ripeti il nome del brand

Il takeaway operativo, derivato direttamente dal principio documentato nel paper di Liu et al. (2025), è questo: nelle pagine chiave, ripeti il brand name esplicitamente ogni 2-3 paragrafi invece di affidarti a pronomi e perifrasi.

Non è una questione di SEO keyword stuffing vecchio stile. È una questione di ridurre la distanza tra pronome e antecedente, così che anche un modello con finestra di contesto limitata, o un modello che processa la pagina a chunk, continui a vedere l’aggancio.

Concretamente, sulla pagina “Chi siamo” del boutique hotel a Venezia:

Prima frase di ogni sezione nuova: nome completo del brand.
All’interno della sezione: puoi usare “la struttura”, “l’hotel”, “noi”, senza paura.
Nuova sezione (nuovo H2): si riparte dal nome completo.

Questo vale in modo ancora più forte per le pagine che descrivono servizi specifici (la SPA, il ristorante, le camere suite affacciate sul Canal Grande, i tour privati). Ogni servizio va agganciato esplicitamente al brand name, altrimenti l’AI può estrarre l’affermazione (“SPA con trattamenti a base di alghe della laguna”) ma non collegarla a te.

Come si controlla la coreference sulle tue pagine

Un check entry level che puoi fare in dieci minuti, senza strumenti a pagamento:

Apri la tua pagina “Chi siamo” o la pagina di un servizio chiave.
Conta le volte in cui appare il brand name completo e le volte in cui appare un pronome o perifrasi (“noi”, “la struttura”, “l’hotel”, “il nostro servizio”).
Se il rapporto è sotto 1 a 5 (un brand name ogni sei riferimenti pronominali), sei in zona rischio.
Apri displaCy ENT, incolla un paragrafo alla volta, e guarda quante entità riconosce. Se il brand name non compare come entità in un paragrafo intero, quel paragrafo per l’AI è “sospeso”.

È un test indicativo, non uno studio. Il campione è la tua pagina, il tool è pubblico e pensato per il NER, non per la coreference resolution vera e propria. Ma il pattern che ti restituisce è coerente con quello che i modelli AI vedono quando processano il tuo testo. L’analisi vera richiede strumenti professionali e modelli di coreference dedicati.

Gli errori che vedo più spesso

Brand name solo nell’H1 e nel footer: tutto il body scorre in prima persona plurale. L’AI vede una lunga sequenza di “noi” e fatica ad agganciarla.
Paragrafi di storytelling lunghi 8-10 righe senza mai ripetere il nome: tipico delle pagine emozionali degli hotel di charme. Il filo si tende troppo.
Sezioni servizi descritte con “il nostro”: “il nostro ristorante”, “la nostra SPA”, “i nostri tour”. L’aggancio è tutto sul possessivo, che è il tipo di riferimento più fragile per un modello.
Testimonial e recensioni staccate dal brand: “gli ospiti amano il nostro rooftop” senza mai nominare la struttura per esteso. La citazione positiva non si aggancia all’entità giusta.

Cosa fare sulle pagine chiave

Azioni operative, in ordine:

Riscrivi gli H2 in modo che almeno il 50% contenga il brand name.
Inserisci il brand name completo come primo soggetto di ogni nuova sezione.
Per le pagine servizi, apri con una frase tipo “[Brand name] + [servizio specifico]”: “Villa San Marco propone un ristorante affacciato sulla laguna”, non “Il nostro ristorante è affacciato sulla laguna”.
Confronta la tua pagina con quelle dei 3-5 boutique hotel veneziani che l’AI cita quando fai query tipo “boutique hotel a Venezia con terrazza sul Canal Grande”: guarda la loro densità di brand name nel body.
Rivedi le testimonianze: ogni recensione riportata deve avere il brand name accanto, non solo “ci siamo trovati benissimo”.

Questo lavoro non è un fattore magico. Non ti porta da invisibile a primo cliente citato. Ma chiude una falla silenziosa che può spiegare mesi di buoni contenuti che non generano menzioni nelle risposte AI.

Il filo che unisce tutto

La coreference resolution è il ponte tra i tuoi contenuti e la tua entità nel knowledge graph dei modelli AI. Se il ponte regge, ogni affermazione che fai lavora per la tua visibilità nelle risposte AI. Se il ponte si spezza, produci contenuto eccellente che però non si attacca al tuo brand.

Nei prossimi articoli di questa serie affronto il lavoro su Entity Salience (quanto il modello ti considera “il soggetto” del tuo testo), su Schema Organization completo (come dichiarare il tuo brand in modo leggibile alle macchine), e su sameAs come collante di identità (come legare il tuo sito ai profili esterni che confermano chi sei).

Il collegamento con author entity recognition che abbiamo visto nel pillar authority è diretto: se il modello non aggancia un pronome al soggetto giusto nel body, figurati nell’attribuire la paternità di un articolo a un autore specifico.