Esistere come entità, non come pagina

Quando l’AI trova tre versioni diverse della tua azienda, smette di consigliarti

Roberto Serra 14 Aprile 2026·~8 min di lettura

Su Wikidata la tua sede è a Milano, su Google Business è a Monza, su Crunchbase è a Sesto San Giovanni: per l'AI non sono imprecisioni, sono contraddizioni che creano dubbio su tutto quello che sa di te. Quando deve scegliere tra te e un competitor i cui dati coincidono ovunque, il modello sceglie il competitor — ogni volta, in silenzio. Un controllo su cinque fonti principali, fatto una volta, ti mette nella condizione di chi viene scelto invece di chi viene scartato.

Un buyer industriale chiede a ChatGPT: “chi produce quadri elettrici a bassa tensione in Lombardia con certificazione ISO per il settore automotive?”. Il modello confronta le fonti, e tra queste c’è TecnoImpianti Soluzioni Industriali. Ma su Wikidata la sede è a Milano, su Google Business Profile a Monza, su Crunchbase a Sesto San Giovanni. Il fondatore su LinkedIn è “Marco Bianchi”, nello schema Organization del sito è “M. Bianchi Rossi”, in un’intervista di settore è “Marco Bianchi-Rossi”.

Risultato: il modello trova contraddizioni, nel dubbio preferisce consigliare un competitor i cui dati coincidono ovunque. È come funziona la knowledge graph reconciliation: il processo con cui i modelli AI confrontano le informazioni su una stessa entità provenienti da fonti diverse, e quando trovano conflitti la confidenza crolla.

In questo articolo ti spiego perché queste discrepanze costano visibilità nelle risposte AI, cosa controllare in 20 minuti, e ti racconto un caso reale su cui abbiamo misurato prima/dopo.

Cosa vede un modello AI quando cerca la tua azienda

Nel mondo della ricerca accademica, il Knowledge Graph è definito come la spina dorsale della rappresentazione della conoscenza strutturata. Lucas Jarnac e colleghi lo mettono nero su bianco nella loro survey del 2024 sulla gestione dell’incertezza nella costruzione dei KG.

Secondo Lucas Jarnac et al., 2024: il Knowledge Graph è l’architettura portante con cui l’AI organizza ciò che sa del mondo.

La tua azienda, se esiste nei sistemi AI, esiste come nodo dentro uno o più di questi grafi.

La conseguenza operativa: se il tuo nodo ha attributi incoerenti tra una fonte e l’altra, il modello deve scegliere chi credere. E quando non ha un criterio chiaro, spesso sceglie di non citarti.

Perché i conflitti abbassano la confidenza del modello

Qui entra in gioco il secondo pezzo del puzzle. Xu e colleghi, nella loro survey sui conflitti di conoscenza per gli LLM, sono molto chiari su cosa succede dentro il modello quando trova informazioni contraddittorie.

“This inconsistency is primarily attributed to the suboptimal quality of datasets utilized during the pre-training phase.”

Xu et al., 2024

L’inconsistenza, anche dopo il fine-tuning, rimane un problema non risolto. Da ciò ne consegue che se tre fonti dicono tre cose diverse sulla tua sede, il modello non inventa la verità: abbassa la confidenza sull’entità.

Lucas Jarnac et al. dettagliano la tipologia di conflitti che fanno più danno.

“On the other hand, Invalidity, Ambiguity, and Timeliness deltas lead to contradictory knowledge, where some parts of the knowledge are necessarily false.”

Lucas Jarnac et al., 2024

Tre categorie di problemi: dati non validi (fondatore sbagliato), dati ambigui (nome con varianti), dati non aggiornati (sede vecchia in circolazione). In tutti e tre i casi il sistema deduce che “una parte della conoscenza è necessariamente falsa”.

Il modello non sa quale parte è falsa, sa solo che qualcosa non torna. E nel dubbio, una risposta AI B2B cita l’entità con dati coerenti, non quella conflittuale.

Errore comune

L’azienda si è trasferita 3 anni fa, Google Business è aggiornato, ma lo schema del sito ha ancora il vecchio indirizzo — spesso in un template di footer che nessuno tocca.

Il collegamento con quello che ti ho già spiegato

Negli articoli precedenti della serie ti ho raccontato come i modelli AI rappresentano il significato con gli embedding in spazi vettoriali e come costruiscono l’autorità di un brand con segnali coerenti. Se vuoi rinfrescare, leggi come funzionano gli embedding vettoriali e come applicare E-E-A-T per l’AI.

La reconciliation del Knowledge Graph sta a monte di tutto. Se l’AI non riesce a decidere chi sei — una sede? due? tre? — nessuna ottimizzazione a valle su embedding o contenuti riesce a compensare.

Pro tip

Apri Google Business Profile, verifica che indirizzo, categoria principale e nome coincidano esattamente con lo schema del sito.

Il test che puoi fare in 20 minuti

Ti do una procedura concreta, con strumenti che esistono davvero.

Passo 1: Wikidata. Vai su Wikidata, cerca il nome esatto della tua azienda. Se esiste una scheda, apri e annota: sede legale, settore, fondatore, data di fondazione, sito ufficiale. Se non esiste una scheda, segnalo — tornerà utile più avanti.

Passo 2: Schema Organization del tuo sito. Apri il Rich Results Test di Google, incolla l’URL della tua homepage, cerca nel risultato il blocco “Organization”. Annota: legalName, address, founder, sameAs (i link esterni che dichiari).

Passo 3: Google Business Profile. Vai su Google Business Profile, apri la tua scheda. Annota: indirizzo, categoria principale, nome legale.

Passo 4: confronto incrociato. Metti i tre set di dati in una tabella. Guarda ogni campo. Se un campo non coincide esattamente tra le tre fonti, è una discrepanza da correggere alla fonte giusta.

Soglia decisionale binaria: o i dati critici (sede, nome legale, settore primario) coincidono al 100%, o hai un problema. Non esiste una via di mezzo.

Il caso che ho seguito: componentistica metallica in Veneto

Un cliente nel manifatturiero veneto, settore componentistica metallica, aveva la sede registrata in due versioni contraddittorie: Treviso sul sito e su Google Business Profile, Padova su Crunchbase e in alcuni articoli di stampa di settore. Su Wikidata non c’era nessuna voce. Quando chiedevo a ChatGPT “dove ha sede [nome azienda]”, il modello rispondeva a volte Treviso, a volte Padova, a volte “non ho informazioni affidabili”. Stesso pattern su Claude e Perplexity.

Abbiamo lavorato tre mesi su tre fronti:

Correzione Crunchbase: apertura ticket con l’account società, aggiornamento della scheda, caricamento della visura camerale come prova.
Outreach verso le testate di settore: email alle redazioni dei tre portali verticali che avevano pubblicato la sede sbagliata, con richiesta di rettifica e link alla pagina “chi siamo”.
Creazione voce Wikidata: scheda con sede verificata, link alla visura camerale come fonte, proprietà P17 (paese), P131 (località), P1448 (nome ufficiale) tutte coerenti.

Dopo altri tre mesi, ripetendo le stesse query, sia ChatGPT sia Claude rispondevano Treviso con alta confidenza, senza più disclaimer sulle fonti discordanti. Perplexity citava esplicitamente Wikidata e il sito ufficiale come fonti concordanti.

La lezione è che i modelli AI non “perdonano” le contraddizioni: aspettano che le fonti si allineino. Finché non si allineano, la tua azienda è trattata come entità a bassa affidabilità, e per un buyer B2B significa non essere citato.

Limiti onesti: è un singolo caso, non uno studio controllato. Il pattern però è coerente con la ricerca accademica citata sopra. L’analisi vera del tuo caso specifico richiede strumenti professionali e un audit entity più strutturato.

Gli errori che vedo più spesso

Quattro pattern ricorrenti dopo decine di casi.

Sede vecchia mai aggiornata. L’azienda si è trasferita 3 anni fa, Google Business è aggiornato, ma lo schema del sito ha ancora il vecchio indirizzo — spesso in un template di footer che nessuno tocca.

Nome legale ballerino. Automeccanica Brescia, Automeccanica Brescia S.r.l., Auto Meccanica Brescia. Per un umano è la stessa cosa. Per il KG sono entità candidate diverse da riconciliare.

Categoria incoerente. Su Google Business sei “Fornitore industriale”, su LinkedIn “Manifattura”, su Crunchbase “Industrial Equipment”. L’AI non capisce in quale settore posizionarti.

sameAs mancante. Nello schema Organization non dichiari i link a LinkedIn, Wikidata, Crunchbase. Il modello deve indovinare che le entità sono la stessa, e spesso sceglie di non unificarle.

Perché la storia dei dati conta

Un’ultima cosa che viene dalla ricerca. Quando i sistemi riconciliano i conflitti, tracciare l’origine e l’incertezza di ogni dato serve a lavorare meglio anche in futuro.

“If these different levels of uncertainty are used for reconciliation, they need to be preserved and represented in the KG as metadata in order to retain a history and could possibly be useful for resolving future conflicts.”

Lucas Jarnac et al., 2024

Tradotto: i livelli di incertezza vengono preservati come metadati per aiutare a risolvere conflitti futuri. Da questo segue che il primo dato “sbagliato” che finisce in un KG pubblico lascia una traccia: anche quando lo correggi, il sistema ricorda che quella fonte è stata inconsistente.

La conseguenza: correggere presto costa meno che correggere tardi. Nel caso veneto, i tre mesi di correzioni sono stati seguiti da altri tre mesi di attesa prima che i modelli recepissero la coerenza. Sei mesi totali per riconquistare risposte affidabili.

Cosa fare concretamente

Un piano di lavoro minimo, trimestrale, che puoi delegare:

Apri Rich Results Test, verifica schema Organization. Se manca o è incompleto, fai aggiungere legalName, address, founder, sameAs con i link a LinkedIn, Wikidata, Crunchbase.
Apri Google Business Profile, verifica che indirizzo, categoria principale e nome coincidano esattamente con lo schema del sito.
Apri Wikidata. Se non esisti, valuta la creazione della scheda (con fonti terze, non autoreferenziali). Se esisti, verifica che i dati siano aggiornati.
Confronta con i 3-5 competitor che l’AI cita quando fai query tematiche nel tuo settore: guarda chi ha dati coerenti e chi no.
Ripeti ogni 3 mesi. I dati si degradano: una nuova sede, un nuovo responsabile, un cambio di denominazione sociale riaprono discrepanze.

Questo è un primo passo onesto. Non è una sostituzione di un audit entity completo, che richiede crawler specializzati e strumenti professionali. È il minimo sindacale per non farsi auto-escludere dalle risposte AI per un problema risolvibile in un pomeriggio.

Perché questo riguarda la tua visibilità nelle risposte AI

La reconciliation del Knowledge Graph non è un fattore magico. Non basta sistemare questi dati per diventare la prima citazione di ChatGPT: servono contenuti, autorità, segnali coerenti. Ma è la base. Se i dati base della tua azienda sono incoerenti, tutto il lavoro a valle — contenuti, backlink, schema avanzati — ha una leva molto più bassa.

La visibilità nelle risposte AI si costruisce su identità chiare. Quando il tuo nodo è un’entità univoca, coerente, ben collegata, l’AI ti riconosce e ha ragioni per citarti. Quando è un nodo confuso, ti evita.

Nei prossimi articoli della serie approfondiamo come costruire relazioni entity-to-entity con i tuoi partner, come gestire la disambiguazione tra brand omonimi, e come sfruttare Wikidata per consolidare l’identità. Se vuoi partire dalle basi, rileggi come funziona il Named Entity Recognition e come l’AI riconosce gli autori come entità.