Entity disambiguation: quando l’AI confonde il tuo brand con un omonimo

Se il tuo brand condivide il nome con un omonimo — un'altra azienda, un professionista, un luogo — l'AI potrebbe stare alimentando la reputazione di qualcun altro con i tuoi contenuti. Non è un problema di visibilità generica: è un problema di identità, e si chiama entity disambiguation. In 15 minuti di test su tre motori AI puoi capire se stai subendo questa confusione. Ti spiego perché il primo filtro per uscire nelle risposte AI non è la qualità del contenuto ma l'identificabilità univoca del soggetto, e come correggere i segnali strutturali che il tuo sito manda oggi.

Apri ChatGPT adesso e chiedi: “notaio per cessione quote SRL a Lecce”. Poi chiedi a Perplexity la stessa cosa. Poi a Gemini. Guarda quali nomi escono, quali URL vengono citate, e soprattutto controlla se il nome dello studio è lo stesso tra i tre motori — oppure se uno dei motori ti propone un omonimo, magari uno studio con lo stesso cognome ma a Brindisi, o un avvocato che si chiama come un notaio.

Questo esercizio è la parte visibile di un problema che nei miei articoli chiamo dissoluzione dell’identità: l’AI ha agganciato il tuo brand all’entità sbagliata, e da quel momento ogni informazione che produci va ad alimentare la reputazione di qualcun altro. Qui ti spiego perché succede, come verificarlo in 15 minuti, e cosa cambiare sul sito per farti riconoscere come entità unica.

Cosa vuol dire “entità ambigua” per un motore AI

Prima che un modello generi una risposta su di te, deve fare una cosa apparentemente banale: decidere quale “Studio Rossi” sei. Nel mondo della ricerca sul knowledge grounding degli LLM, questo passaggio ha un nome preciso.

“This task is known as Entity Linking (EL), and it is a fundamental step in the transformation of unstructured text into structured knowledge.”Pons et al. (2025)

Tradotto: il motore prende una stringa ambigua (“Studio Rossi”, “Notaio Bianchi”, “Caseificio Amato”) e la collega a una entry univoca in una base di conoscenza strutturata. Se questo collegamento va a buon fine, le informazioni su di te si accumulano sotto la tua entry. Se va storto, si accumulano sotto un omonimo, e per il motore tu diventi invisibile.

La conseguenza operativa è semplice: il primo filtro per uscire nelle risposte AI non è la qualità del contenuto, è l’identificabilità univoca del soggetto. Se l’AI non sa chi sei, il resto non conta.

Perché è il primo step, non l’ultimo

Negli articoli precedenti di questa serie ti ho raccontato come i motori AI leggano il testo — lo spezzano in token e lo proiettano in uno spazio vettoriale dove i concetti vicini finiscono vicini. La disambiguation sta a monte anche di questi passaggi: se l’entità sbagliata entra nel vettore, tutto il resto della pipeline lavora sul soggetto sbagliato.

Nel mondo della ricerca sull’entity linking applicato agli LLM, questo passaggio è descritto come un pezzo fondante dell’information extraction.

“Preprint submitted to Knowledge-Based Systems May 23, 2025 Entity disambiguation (ED), a crucial task in information extraction (IE), involves link- ing text fragments representing real-world entities to entries in structured knowledge bases like encyclopedias or dictionaries.”Ding et al. (2024)

Da questo segue che se il tuo sito non offre segnali chiari per l’aggancio alla entry giusta — o peggio, offre segnali che portano a una entry diversa dalla tua — nessuna ottimizzazione successiva ti salva. L’AI continuerà a parlare di un altro.

Il test di reverse engineering che puoi fare in 15 minuti

Non serve un tool professionale per capire se hai un problema di disambiguazione. Serve pazienza e un foglio di calcolo.

  1. Scegli 5 query che un tuo cliente realistico farebbe. Per uno studio notarile di Lecce: “notaio cessione quote Lecce”, “atto di donazione immobile Salento”, “notaio mutuo prima casa Puglia”, eccetera.
  2. Fai ciascuna query su tre motori: ChatGPT (con ricerca web attiva), Perplexity, Gemini.
  3. Annota in una tabella: il nome dello studio citato, l’URL della fonte, la città che il motore associa al nome.
  4. Incrocia i dati. Se lo stesso nome compare su più motori ma con città o specializzazioni diverse, hai un problema di disambiguazione in corso.
  5. Apri Wikidata e cerca il tuo brand. Se non esiste una entry, o se esiste ma è scarna, è un indizio forte: non hai ancora una identità consolidata nel grafo di conoscenza pubblico.

Soglia decisionale binaria: se su 15 risposte (5 query × 3 motori) trovi anche solo 2-3 confusioni con omonimi, sei in zona rossa. Non è un margine fisiologico.

Il test che ho fatto io

Ho provato questo esercizio su 12 query del tipo “miglior [professione] a [città media italiana]” — notai, commercialisti, studi dentistici, architetti. Quando chiedevo la stessa query a ChatGPT e Perplexity, su 12 query 7 mi restituivano un set di fonti con una caratteristica in comune: le fonti citate non erano il sito ufficiale dello studio, ma directory di settore (pagine gialle locali, albi professionali, portali di recensioni). Nelle altre 5 query il sito ufficiale compariva, ma solo quando il nome dello studio era già raro di per sé (cognomi infrequenti, nomi compositi).

Limiti del test: campione piccolo, query costruite da me, risultati dipendenti dal giorno della query. È un’osservazione indicativa, non uno studio. Ma il pattern è chiaro: quando il nome è ambiguo, l’AI si appoggia al terzo che ha già fatto il lavoro di disambiguare al posto suo — e quel terzo è una directory, non sei tu.

La cosa interessante è che nel mondo della ricerca questo meccanismo è stato misurato direttamente.

“Entity Disambiguation A performance comparison over six entity disambiguation benchmarks is presented in Table 1.”Ding et al. (2024)

Ding et al. confrontano diversi sistemi di entity disambiguation su sei benchmark: la performance varia parecchio a seconda del contesto. La conseguenza per il tuo business è che i motori AI non sono infallibili nella disambiguazione, e se non gli dai segnali forti restano sulla scelta più probabile statisticamente — che quasi mai è la tua PMI.

Gli errori che vedo più spesso

Quando lavoro sui siti dei clienti, quattro pattern si ripresentano in modo quasi identico.

  • About page generica. “Siamo uno studio professionale con decenni di esperienza”. Zero elementi che ti distinguono da altri 2.000 studi italiani con la stessa frase. Per l’AI sei indistinguibile dagli omonimi.
  • Zero sameAs. Il sito non linka i profili LinkedIn, Wikidata, albo professionale ufficiale, Google Business Profile. Senza questi ponti, il motore non sa che “Studio Notarile Amato su LinkedIn” e “Studio Notarile Amato sul sito” sono la stessa entità.
  • Nessun identificatore univoco. Partita IVA, codice fiscale, numero di iscrizione all’albo, LEI code per chi fa finanza: questi sono gli appigli forti che un grafo usa per non confonderti. Se non li metti nello schema, il motore resta sul nome e cognome.
  • Nome sede ambiguo. “Sede a Lecce” senza via, senza CAP, senza coordinate. Se in Italia ci sono altri studi con lo stesso cognome in Salento, il motore non ha modo di separarvi.

Cosa sistemare sul sito (ordine di priorità)

  • Riscrivi la About con una descrizione univoca: cosa fai esattamente, in che ambito, in che zona, da quando, con quali specializzazioni. Se un altro studio con il tuo cognome può copiare-incollare la tua About senza modifiche, non sei disambiguato.
  • Aggiungi il blocco sameAs nello schema Organization o ProfessionalService. Linka tutti i profili ufficiali: LinkedIn aziendale, pagina Facebook, Google Business Profile, albo professionale se pubblico, eventuale entry Wikidata.
  • Inserisci identificatori univoci nello schema: `”identifier”` con la Partita IVA, il codice dell’albo professionale, il LEI code se applicabile. Questi sono i ganci che un knowledge graph usa per assegnarti una entry dedicata.
  • Verifica il risultato con il Rich Results Test di Google: incolla l’URL homepage, guarda se lo schema Organization compare pulito, se sameAs ha tutti i link, se identifier è presente.
  • Apri Google Business Profile: verifica che nome, indirizzo, numero di telefono corrispondano esattamente a quelli del sito. Discrepanze anche minime (Via vs V., S.r.l. vs SRL) alimentano la confusione.

Questi passaggi sono un entry level onesto. L’analisi vera di come il grafo di conoscenza di Google e dei motori AI ti vede richiede strumenti professionali e un lavoro di mesi, ma se questi quattro blocchi sono a posto sei già nella minoranza delle PMI italiane con un’identità leggibile.

Il filo che tiene tutto

Uscire nelle risposte AI non è una questione di aver scritto articoli “ottimizzati”: è prima di tutto una questione di essere una entità riconoscibile. Se il motore non sa quale “Studio Amato” sei, ogni contenuto che produci va a vantaggio dell’ambiguità, non tua. La disambiguazione è il gesto che rende utilizzabile tutto il resto — E-E-A-T, riconoscimento dell’autore, struttura dei contenuti. Senza disambiguazione a monte, stai costruendo reputazione per un omonimo.

Nei prossimi articoli di questa serie entrerò nel dettaglio dei mattoni operativi: come costruire la entry del tuo brand nel grafo di Google, come mappare le relazioni tra la tua entità e le altre del tuo settore, come manutenere tutto questo nel tempo con un audit periodico.

Quanto è visibile il tuo brand per le AI?

Scoprilo in 30 secondi con il nostro tool gratuito. 11 check automatici, risultati immediati.

Roberto Serra

Mi chiamo Roberto Serra e sono un digital marketer con una forte passione per la SEO: Mi occupo di posizionamento sui motori di ricerca, strategia digitale e creazione di contenuti.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Quanto è visibile il tuo brand per le AI? Analizza il tuo brand