La sede della tua azienda è a Milano su Wikidata, a Monza su Google Business e a Sesto San Giovanni su Crunchbase. Il fondatore ha tre grafie diverse su tre piattaforme. Per i motori AI queste non sono imprecisioni: sono contraddizioni che abbassano la confidenza sull'intera entità. E quando il modello deve scegliere chi consigliare tra te e un competitor i cui dati coincidono ovunque, sceglie l'altro. Non è un problema di contenuti, né di autorevolezza — è un problema di coerenza dei dati. Un audit trimestrale su cinque fonti (Wikidata, Knowledge Graph Google, schema Organization, Google Business, Crunchbase) ti protegge da questo meccanismo. Ti spiego cosa controllare e come correggere ogni discrepanza.
Un buyer industriale chiede a ChatGPT: “chi produce quadri elettrici a bassa tensione in Lombardia con certificazione ISO per il settore automotive?”. Il modello confronta le fonti, e tra queste c’è TecnoImpianti Soluzioni Industriali. Ma su Wikidata la sede è a Milano, su Google Business Profile a Monza, su Crunchbase a Sesto San Giovanni. Il fondatore su LinkedIn è “Marco Bianchi”, nello schema Organization del sito è “M. Bianchi Rossi”, in un’intervista di settore è “Marco Bianchi-Rossi”.
Risultato: il modello trova contraddizioni, nel dubbio preferisce consigliare un competitor i cui dati coincidono ovunque. È come funziona la knowledge graph reconciliation: il processo con cui i modelli AI confrontano le informazioni su una stessa entità provenienti da fonti diverse, e quando trovano conflitti la confidenza crolla.
In questo articolo ti spiego perché queste discrepanze costano visibilità nelle risposte AI, cosa controllare in 20 minuti, e ti racconto un caso reale su cui abbiamo misurato prima/dopo.
Cosa vede un modello AI quando cerca la tua azienda
Nel mondo della ricerca accademica, il Knowledge Graph è definito come la spina dorsale della rappresentazione della conoscenza strutturata. Guo e colleghi lo mettono nero su bianco nella loro survey del 2024 sulla gestione dell’incertezza nella costruzione dei KG.
“Knowledge Graphs Before going into further detail on reconciliation approaches, it is important to define KGs, which are the core of this survey.” — Guo et al., 2024
Tradotto: il Knowledge Graph è l’architettura portante con cui l’AI organizza ciò che sa del mondo. La tua azienda, se esiste nei sistemi AI, esiste come nodo dentro uno o più di questi grafi.
La conseguenza operativa: se il tuo nodo ha attributi incoerenti tra una fonte e l’altra, il modello deve scegliere chi credere. E quando non ha un criterio chiaro, spesso sceglie di non citarti.
Perché i conflitti abbassano la confidenza del modello
Qui entra in gioco il secondo pezzo del puzzle. Xu e colleghi, nella loro survey sui conflitti di conoscenza per gli LLM, sono molto chiari su cosa succede dentro il modello quando trova informazioni contraddittorie.
“This inconsistency is primarily attributed despite fine-tuning.” — Xu et al., 2024
L’inconsistenza, anche dopo il fine-tuning, rimane un problema non risolto. Da questo segue che se tre fonti dicono tre cose diverse sulla tua sede, il modello non inventa la verità: abbassa la confidenza sull’entità.
Guo et al. dettagliano la tipologia di conflitti che fanno più danno.
“On the other hand, Invalidity, Ambiguity, and Timeliness deltas lead to contradictory knowledge, where some parts of the knowledge are necessarily false.” — Guo et al., 2024
Tre categorie di problemi: dati non validi (fondatore sbagliato), dati ambigui (nome con varianti), dati non aggiornati (sede vecchia in circolazione). In tutti e tre i casi il sistema deduce che “una parte della conoscenza è necessariamente falsa”.
Il modello non sa quale parte è falsa, sa solo che qualcosa non torna. E nel dubbio, una risposta AI B2B cita l’entità con dati coerenti, non quella conflittuale.
Il collegamento con quello che ti ho già spiegato
Negli articoli precedenti della serie ti ho raccontato come i modelli AI rappresentano il significato con gli embedding in spazi vettoriali e come costruiscono l’autorità di un brand con segnali coerenti. Se vuoi rinfrescare, leggi come funzionano gli embedding vettoriali e come applicare E-E-A-T per l’AI.
La reconciliation del Knowledge Graph sta a monte di tutto. Se l’AI non riesce a decidere chi sei — una sede? due? tre? — nessuna ottimizzazione a valle su embedding o contenuti riesce a compensare.
Il test che puoi fare in 20 minuti
Ti do una procedura concreta, con strumenti che esistono davvero.
Passo 1: Wikidata. Vai su Wikidata, cerca il nome esatto della tua azienda. Se esiste una scheda, apri e annota: sede legale, settore, fondatore, data di fondazione, sito ufficiale. Se non esiste una scheda, segnalo — tornerà utile più avanti.
Passo 2: Schema Organization del tuo sito. Apri il Rich Results Test di Google, incolla l’URL della tua homepage, cerca nel risultato il blocco “Organization”. Annota: legalName, address, founder, sameAs (i link esterni che dichiari).
Passo 3: Google Business Profile. Vai su Google Business Profile, apri la tua scheda. Annota: indirizzo, categoria principale, nome legale.
Passo 4: confronto incrociato. Metti i tre set di dati in una tabella. Guarda ogni campo. Se un campo non coincide esattamente tra le tre fonti, è una discrepanza da correggere alla fonte giusta.
Soglia decisionale binaria: o i dati critici (sede, nome legale, settore primario) coincidono al 100%, o hai un problema. Non esiste una via di mezzo.
Il caso che ho seguito: componentistica metallica in Veneto
Un cliente nel manifatturiero veneto, settore componentistica metallica, aveva la sede registrata in due versioni contraddittorie: Treviso sul sito e su Google Business Profile, Padova su Crunchbase e in alcuni articoli di stampa di settore. Su Wikidata non c’era nessuna voce. Quando chiedevo a ChatGPT “dove ha sede [nome azienda]”, il modello rispondeva a volte Treviso, a volte Padova, a volte “non ho informazioni affidabili”. Stesso pattern su Claude e Perplexity.
Abbiamo lavorato tre mesi su tre fronti:
- Correzione Crunchbase: apertura ticket con l’account società, aggiornamento della scheda, caricamento della visura camerale come prova.
- Outreach verso le testate di settore: email alle redazioni dei tre portali verticali che avevano pubblicato la sede sbagliata, con richiesta di rettifica e link alla pagina “chi siamo”.
- Creazione voce Wikidata: scheda con sede verificata, link alla visura camerale come fonte, proprietà P17 (paese), P131 (località), P1448 (nome ufficiale) tutte coerenti.
Dopo altri tre mesi, ripetendo le stesse query, sia ChatGPT sia Claude rispondevano Treviso con alta confidenza, senza più disclaimer sulle fonti discordanti. Perplexity citava esplicitamente Wikidata e il sito ufficiale come fonti concordanti.
La lezione è che i modelli AI non “perdonano” le contraddizioni: aspettano che le fonti si allineino. Finché non si allineano, la tua azienda è trattata come entità a bassa affidabilità, e per un buyer B2B significa non essere citato.
Limiti onesti: è un singolo caso, non uno studio controllato. Il pattern però è coerente con la ricerca accademica citata sopra. L’analisi vera del tuo caso specifico richiede strumenti professionali e un audit entity più strutturato.
Gli errori che vedo più spesso
Quattro pattern ricorrenti dopo decine di casi.
Sede vecchia mai aggiornata. L’azienda si è trasferita 3 anni fa, Google Business è aggiornato, ma lo schema del sito ha ancora il vecchio indirizzo — spesso in un template di footer che nessuno tocca.
Nome legale ballerino. Automeccanica Brescia, Automeccanica Brescia S.r.l., Auto Meccanica Brescia. Per un umano è la stessa cosa. Per il KG sono entità candidate diverse da riconciliare.
Categoria incoerente. Su Google Business sei “Fornitore industriale”, su LinkedIn “Manifattura”, su Crunchbase “Industrial Equipment”. L’AI non capisce in quale settore posizionarti.
sameAs mancante. Nello schema Organization non dichiari i link a LinkedIn, Wikidata, Crunchbase. Il modello deve indovinare che le entità sono la stessa, e spesso sceglie di non unificarle.
Perché la storia dei dati conta
Un’ultima cosa che viene dalla ricerca. Quando i sistemi riconciliano i conflitti, tracciare l’origine e l’incertezza di ogni dato serve a lavorare meglio anche in futuro.
“If these different levels of uncertainty are used for reconciliation, they need to be preserved and represented in the KG as metadata in order to retain a history and could possibly be useful for resolving future conflicts.” — Guo et al., 2024
Tradotto: i livelli di incertezza vengono preservati come metadati per aiutare a risolvere conflitti futuri. Da questo segue che il primo dato “sbagliato” che finisce in un KG pubblico lascia una traccia: anche quando lo correggi, il sistema ricorda che quella fonte è stata inconsistente.
La conseguenza: correggere presto costa meno che correggere tardi. Nel caso veneto, i tre mesi di correzioni sono stati seguiti da altri tre mesi di attesa prima che i modelli recepissero la coerenza. Sei mesi totali per riconquistare risposte affidabili.
Cosa fare concretamente
Un piano di lavoro minimo, trimestrale, che puoi delegare:
- Apri Rich Results Test, verifica schema Organization. Se manca o è incompleto, fai aggiungere legalName, address, founder, sameAs con i link a LinkedIn, Wikidata, Crunchbase.
- Apri Google Business Profile, verifica che indirizzo, categoria principale e nome coincidano esattamente con lo schema del sito.
- Apri Wikidata. Se non esisti, valuta la creazione della scheda (con fonti terze, non autoreferenziali). Se esisti, verifica che i dati siano aggiornati.
- Confronta con i 3-5 competitor che l’AI cita quando fai query tematiche nel tuo settore: guarda chi ha dati coerenti e chi no.
- Ripeti ogni 3 mesi. I dati si degradano: una nuova sede, un nuovo responsabile, un cambio di denominazione sociale riaprono discrepanze.
Questo è un primo passo onesto. Non è una sostituzione di un audit entity completo, che richiede crawler specializzati e strumenti professionali. È il minimo sindacale per non farsi auto-escludere dalle risposte AI per un problema risolvibile in un pomeriggio.
Perché questo riguarda la tua visibilità nelle risposte AI
La reconciliation del Knowledge Graph non è un fattore magico. Non basta sistemare questi dati per diventare la prima citazione di ChatGPT: servono contenuti, autorità, segnali coerenti. Ma è la base. Se i dati base della tua azienda sono incoerenti, tutto il lavoro a valle — contenuti, backlink, schema avanzati — ha una leva molto più bassa.
La visibilità nelle risposte AI si costruisce su identità chiare. Quando il tuo nodo è un’entità univoca, coerente, ben collegata, l’AI ti riconosce e ha ragioni per citarti. Quando è un nodo confuso, ti evita.
Nei prossimi articoli della serie approfondiamo come costruire relazioni entity-to-entity con i tuoi partner, come gestire la disambiguazione tra brand omonimi, e come sfruttare Wikidata per consolidare l’identità. Se vuoi partire dalle basi, rileggi come funziona il Named Entity Recognition e come l’AI riconosce gli autori come entità.
Quanto è visibile il tuo brand per le AI?
Scoprilo in 30 secondi con il nostro tool gratuito. 11 check automatici, risultati immediati.