Esistere come entità, non come pagina

Wikidata come backbone semantico: la voce che fa esistere il tuo brand per l’AI

Roberto Serra 14 Aprile 2026·~6 min di lettura

I brand che ChatGPT cita con sicurezza hanno quasi tutti qualcosa in comune: una voce compilata su Wikidata, il grande archivio di conoscenza strutturata che alimenta Google, Bing e molti sistemi AI. Chi non ce l'ha, o ce l'ha vuota, è rumore che il modello preferisce ignorare per non rischiare errori. Non è una questione tecnica complessa: sei proprietà compilate nel modo giusto bastano per creare una voce che i modelli trattano come fonte affidabile. Si fa in meno di un'ora.

I brand che ChatGPT cita con alta confidenza, quando ti risponde a una domanda verticale, hanno quasi tutti una cosa in comune: una voce Wikidata ricca di attributi, con proprietà compilate, sito web, sede, anno di fondazione, settore, persone coinvolte. I brand che l’AI non cita mai, invece, spesso non hanno proprio la voce. Oppure ce l’hanno ma vuota, con tre righe e nessuna proprietà collegata.

Questa non è una coincidenza. Wikidata è una delle fonti strutturate che alimentano i Knowledge Graph di Google, Bing e diversi sistemi AI moderni. Se la tua scheda non c’è, o è scheletrica, stai giocando la partita della visibilità AI senza aver compilato il modulo anagrafe.

Ti spiego cos’è davvero Wikidata per un modello AI, perché sta a monte di quasi tutto quello che ti ho raccontato in questa serie, e come creare una voce che funzioni.

Cos’è Wikidata per un modello AI

Nel mondo della ricerca sul rapporto tra modelli linguistici e grafi di conoscenza, Wikidata occupa una posizione precisa. Il survey di Cedric Möller et al. (2021) sull’entity linking su Wikidata la descrive come un grafo di conoscenza aggiornato di continuo, mantenuto dalla community e multilingua. Il lavoro di Wu et al. (2023) sull’integrazione tra LLM e knowledge graph la colloca tra i grafi enciclopedici più usati come fonte di conoscenza esterna per i sistemi AI.

Attenzione però, Wikidata non è Wikipedia: non è un’enciclopedia narrativa, è un database strutturato. Ogni entità (tu, il tuo brand, un prodotto, una persona) ha un codice identificativo (il Q-number) e una serie di proprietà collegate a valori verificabili. Tipo di attività, sito web, sede, fondatore, anno di fondazione, settore, premi ricevuti, pubblicazioni.

Tradotto in pratica, quando un sistema AI deve dare una risposta su un brand, un’azienda, un professionista, una delle strade che può percorrere è l’aggancio a un’entità nota in un grafo come Wikidata. Se l’entità non c’è, il modello si affida solo a quello che ha letto sparso nel testo durante il training. Meno affidabile, meno citabile, meno probabile nelle risposte.

Perché Wikidata sta a monte di tutto il resto

Negli articoli precedenti di questa serie ti ho raccontato come l’AI rappresenta i concetti nello spazio vettoriale degli embedding e come riconosce un autore come entità con l’author entity recognition. Wikidata è il livello sotto.

È il registro dove il tuo brand smette di essere “una stringa di testo che compare qui e là” e diventa un’entità con identità stabile. Con un codice, con proprietà verificabili, con link esterni a siti autorevoli, con traduzioni multilingua.

Il motivo per cui tutto il lavoro che fai a valle (schema markup, E-E-A-T, contenuti ben strutturati) rende di più quando hai una voce Wikidata compilata è semplice: dai al sistema AI un punto di ancoraggio disambiguato. “Questo brand qui” invece di “forse questo brand, forse un altro con nome simile”.

La deduzione per te è lineare: se la tua entità è ben rappresentata in quel tipo di grafo, sei materiale utilizzabile per la risposta. Se non lo è, sei rumore che il modello preferisce non citare per non sbagliare.

Errore comune

Se la tua scheda non c’è, o è scheletrica, stai giocando la partita della visibilità AI senza aver compilato il modulo anagrafe.

Il test che puoi fare in dieci minuti

Vai su wikidata.org e cerca il nome esatto del tuo brand. Tre esiti possibili:

Nessun risultato: non esisti nel grafo. Zero ancoraggio semantico per l’AI.
Risultato con scheda scarna: ci sei, ma hai solo nome e una o due proprietà. Poco da citare.
Risultato con scheda ricca: hai P31 (istanza di), P856 (sito web), P159 (sede), P112 (fondatore), P571 (data di fondazione), P452 (settore) compilate. Sei citabile.

La soglia binaria da cui partire è semplice: se cerchi il tuo brand e non trovi nulla, o trovi una voce con meno di 5 proprietà valorizzate, sei sotto la soglia minima. Non è l’analisi vera, che richiede strumenti professionali e controllo degli alias linguistici, ma è un primo passo onesto.

Poi fai la controprova: apri ChatGPT o Perplexity e chiedi “cosa sai di [nome del tuo brand]?”. Se la risposta è generica, confusa o inventa cose, è un segnale coerente. Se nomina con precisione anno di fondazione, sede, settore, c’è un buon ancoraggio a monte.

Pro tip

Compila almeno queste sei proprietà: P31 (tipo specifico, non generico), P856 (sito web ufficiale), P159 (sede), P112 (fondatore), P571 (data di fondazione), P452 (settore verticale).

Un caso che ho seguito: un torrefattore di Parma

Un torrefattore artigianale di Parma che lavora con me aveva una situazione tipica della food specialty dell’Emilia gastronomica: sito ben fatto, qualità del prodotto riconosciuta, presenza su riviste di settore del caffè, ma zero visibilità nelle risposte AI su query del tipo “torrefazioni artigianali Emilia-Romagna” o “micro-torrefazioni specialty coffee Italia”. Perplexity citava sempre gli stessi tre-quattro nomi, lui non compariva mai.

Controllo su Wikidata: voce assente. Nessun Q-number. Sul Knowledge Graph di Google, idem, nessun pannello.

L’intervento è stato puntuale: creazione della voce Wikidata con P31 (impresa), P856 (sito web), P159 (sede a Parma), P112 (fondatore), P571 (anno fondazione), P452 (settore: torrefazione di caffè), più link esterni alle recensioni della stampa specializzata e agli articoli di riviste food. Non magia, compilazione accurata e riferimenti esterni verificabili.

Dopo circa cinque mesi, su un campione di 15 query che testiamo mensilmente su ChatGPT e Perplexity, il brand è passato da zero citazioni a comparire in 6 risposte su 15. Test indicativo, non studio: campione piccolo, niente gruppo di controllo, e nel frattempo abbiamo lavorato anche su altri fronti (struttura contenuti, schema sul sito). Ma il pattern è coerente con quello che vedo su altri clienti del food specialty: la voce Wikidata non basta da sola, non è un interruttore magico, ma sposta l’ago in modo percepibile quando a valle hai un sito fatto bene.

Gli errori che vedo più spesso

Nei piccoli produttori food dell’Emilia gastronomica, e non solo, questi sono i pattern ricorrenti:

Voce creata e abbandonata. Scheda con tre proprietà e poi più nessun aggiornamento. Wikidata è un grafo vivo: se non cresce, invecchia male.
P31 sbagliato o generico. Mettere “business” invece di “torrefazione”, “cantina”, “pastificio artigianale”. Perdi la classificazione verticale, che è proprio quella che fa scattare la citazione su query di settore.
Nessun link esterno autorevole. Una voce senza riferimenti a fonti terze (stampa, associazioni di categoria, database di settore) è fragile. Può anche essere candidata alla cancellazione dalla community.
Descrizione autoreferenziale. Frasi tipo “la migliore torrefazione artigianale del nord Italia” vengono rimosse. Wikidata vuole fatti neutri: “torrefazione di caffè specialty fondata nel [anno] a [città]”.

Confronta la tua scheda (o la sua assenza) con i 3-5 competitor che l’AI cita più spesso nelle tue query di settore: molte volte la differenza è esattamente qui.

Cosa fare concretamente

Cerca il tuo brand su wikidata.org. Se non esiste, crea la voce.
Compila almeno queste sei proprietà: P31 (tipo specifico, non generico), P856 (sito web ufficiale), P159 (sede), P112 (fondatore), P571 (data di fondazione), P452 (settore verticale).
Aggiungi identificativi esterni dove li hai: eventuali registri di categoria, profili autorevoli.
Inserisci almeno 2-3 riferimenti a fonti terze (stampa di settore, associazioni, cataloghi riconosciuti).
Dopo 2-3 mesi, ritesta le query di settore su ChatGPT e Perplexity e confronta con la baseline.

L’analisi vera, con mappatura completa degli alias, monitoraggio delle proprietà mancanti rispetto ai competitor e integrazione con schema markup sul sito, richiede strumenti professionali e mano più esperta. Questo è il primo passo da cui partire.

Capitolo 4 · Esistere come entità, non come pagina

Prosegui la lettura degli approfondimenti

40 approfondimenti, divisi nelle 5 sezioni del capitolo.

4.1 Entity Recognition 8 approfondimenti

Brand nuovo e invisibile nelle risposte AI: come accelerare il riconoscimento Il tuo brand in italiano e in inglese sono la stessa entità per l’AI? Probabilmente no Quando l’AI non capisce più che “noi” sei tu: il problema della coreference Entity Linking: perché 50 menzioni del tuo brand valgono zero se l’AI non le collega Il tuo brand compare nelle risposte AI, ma come ti classifica? Entity salience: perché essere nominato una volta è come non essere nominato Entity disambiguation: quando l’AI confonde il tuo brand con un omonimo Named Entity Recognition: come l’AI decide se il tuo brand è “qualcuno” o solo testo

4.2 Knowledge Graph Optimization 8 approfondimenti

Product Entity vs Brand Entity: perché l’AI può conoscere il tuo nome senza sapere cosa vendi Rich Entity Attributes: perché l’AI cita con dettaglio solo le entità “grasse” Quando l’AI trova tre versioni diverse della tua azienda, smette di consigliarti Il codice fiscale del tuo brand nell’ecosistema AI sameAs: il collante che tiene insieme la tua identità per l’AI Schema Organization completo: la carta d’identità machine-readable del tuo brand Wikidata come backbone semantico: la voce che fa esistere il tuo brand per l’AI Sei qui Entrare nel Knowledge Graph di Google: perché senza sei solo testo per Gemini

4.3 Entity Relationships 8 approfondimenti

Client Portfolio come Entity Network: perché i tuoi clienti sono nodi che ti rafforzano Alumni & Affiliation Network: le tue connessioni istituzionali nel grafo dell’AI Eventi come speaker: perché ogni conferenza è un nodo di autorità per l’AI Supply Chain Entity Mapping: come i partner dicono all’AI chi sei Industry Vertical Classification: la categoria che ti rende visibile (o invisibile) nelle risposte AI Associazione entità-luogo: perché Perplexity sa chi consigliare in Sardegna (e tu forse no) Competitor Entity Graph: perché l’AI cita sempre gli stessi 4-5 brand del tuo settore L’AI non ti cita da solo: ti cita dentro una rete di relazioni

4.4 Entità Verticali & Locali 8 approfondimenti

Product/Service Schema per Query Transazionali Directory verticali di settore: perché l’AI pesca da lì le sue raccomandazioni Professional Registry Entity: perché l’Albo è la tua prova di esistenza per l’AI Franchise e multi-location: perché l’AI non somma l’autorità delle tue sedi Perché l’AI raccomanda blog generalisti al posto del tuo studio medico (e come si ribalta) Chi è il dentista di Cagliari secondo ChatGPT? La risposta dipende dal Knowledge Graph della tua città NAP Consistency: perché l’AI ti manda clienti al numero sbagliato Google Business Profile come entità primaria: perché l’AI ti guarda da lì prima che dal sito

4.5 Entity Monitoring & Manutenzione 8 approfondimenti

Entity recovery dopo una crisi reputazionale: come ripulire la tua entità nel Knowledge Graph Entity Decay: perché l’AI smette di citarti (e come rientrare nelle risposte) Il tuo brand esiste in quattro versioni parallele (e non lo sai) Entity Confidence Testing: leggere il linguaggio dell’AI per capire quanto si fida del tuo brand Training Data Lifecycle: perché le correzioni al tuo sito non arrivano subito nell’AI Knowledge Graph Poisoning Prevention: come proteggere la tua entità da informazioni false che l’AI prende per vere AI Response Monitoring per Entity: come scoprire se l’AI racconta il tuo brand con i dati giusti Entity Audit Periodico: perché i tuoi dati invecchiano anche quando non te ne accorgi

L'autore

Roberto Serra al Senato della Repubblica

Senato della Repubblica · Palazzo Giustiniani Convegno “Il potere dell'intelligenza artificiale”

Roberto Serra

Consulente SEO da oltre 15 anni, fondatore dell'Agenzia SEO Serra (RAANK). Aiuta multinazionali e PMI a restare visibili dove la ricerca si sta spostando: ChatGPT, Perplexity, Gemini e gli AI Overviews di Google.

Ne hanno parlato

Scopri di più su Roberto Serra →