Esistere come entità, non come pagina

Rich Entity Attributes: perché l’AI cita con dettaglio solo le entità “grasse”

Roberto Serra 14 Aprile 2026·~8 min di lettura

Chiedi a Perplexity i migliori cantieri di refitting yacht in Italia: i primi due o tre vengono descritti con anno di fondazione, certificazioni e specializzazioni, mentre gli altri vengono liquidati con "tra gli altri operano anche..." — quasi un'invisibilità. Non è questione di chi lavora meglio: il modello ha poco da dire su chi ha pochi dati dichiarati, e quando ha poco da dire non ti raccomanda. Compilare le informazioni giuste nei posti giusti è più semplice di quanto sembri — e può spostare il tuo nome dalla lista di fondo alla citazione di apertura.

Chiedi a Perplexity “migliori cantieri di refitting yacht in Italia”. Guarda la risposta. Le due o tre aziende citate in cima hanno un elemento in comune: descrizione ricca. Non una riga, non un claim generico. Anno di fondazione, sede, tipo di interventi (verniciatura, carpenteria, impianti), taglia delle unità trattate, premi o riconoscimenti, nomi dei cantieri partner.

Le altre — quelle che la risposta liquida con “tra gli altri cantieri operano anche…” — hanno profili scheletrici. Tre attributi, quattro al massimo. E il modello, non avendo nulla da dire, le cita al volo e passa oltre.

Questa è la differenza tra un’entità ricca di attributi e un’entità povera. Nei miei articoli della serie su Entity e Knowledge Graph ti ho spiegato cos’è un’entità, come viene disambiguata, come viene agganciata a Wikidata. Oggi ti mostro il meccanismo che decide se il modello ti cita con dettaglio o ti lascia nell’ombra: il numero e la qualità di attributi che l’AI riesce a recuperare sul tuo brand.

Cosa sono gli attributi di un’entità per un modello AI

Un’entità, per un LLM, non è un nome. È un nodo con tutto quello che ci sta attaccato. Se parliamo di un cantiere navale a La Spezia, gli attributi utili al modello sono: fondatore, anno di nascita, sede esatta, settore (refitting? costruzione ex novo? entrambi?), tipi di yacht trattati (sail, motor, megayacht), lunghezze massime dello scalo, certificazioni RINA o Lloyd’s, premi di settore, prodotti/servizi principali, partnership con designer o broker internazionali.

Più questi attributi sono presenti — e ripetuti in modo coerente tra schema markup sul sito, Wikidata, profili LinkedIn, directory di settore, articoli di stampa — più il modello “sa” di te. E più riempie la risposta con informazione utile quando qualcuno fa una query nel tuo settore.

Il principio documentato dalla ricerca sul Knowledge Graph

Nel mondo della ricerca sul Knowledge Graph, un filone recente si occupa di come arricchire automaticamente le entità di un grafo a partire dalla letteratura e dal web. Il paper KARMA di Yuxing Lu et al. (2025) descrive un framework multi-agente in cui diversi LLM specializzati leggono documenti, estraggono nuovi attributi, li verificano tra loro e poi li integrano nel grafo esistente. La logica dichiarata dagli autori è che la curazione manuale è affidabile ma non scala, mentre una pipeline automatica con controlli incrociati riesce a bilanciare accuratezza, coerenza e usabilità nell’arricchimento del grafo.

Da questo segue che i grandi grafi di conoscenza — quelli che alimentano gli LLM che rispondono a chi cerca “cantiere refitting yacht Liguria” — non vengono più popolati a mano. Vengono arricchiti da pipeline che leggono il web, estraggono attributi, li confrontano tra fonti multiple, e tengono solo quelli che passano i controlli di coerenza.

La conseguenza operativa per il tuo business è diretta: se il tuo brand non pubblica attributi in forma leggibile dalle macchine (schema markup, Wikidata, profili esterni strutturati), queste pipeline non hanno nulla da raccogliere su di te. E l’entità rimane scheletrica per sempre, perché nessuno la curerà più a mano.

Tradotto in pratica: il motore AI non può “vederti ricco” se il web non ti descrive ricco in modo coerente. E la coerenza tra fonti non è un accessorio, è il criterio principale di selezione.

Errore comune

Un’entità con 3 attributi (nome, città, settore generico) produce risposte vaghe: “c’è anche Cantiere X a La Spezia”.

Perché gli attributi ricchi stanno a monte della citazione AI

Negli articoli precedenti ti ho mostrato come il modello capisce che esisti grazie al Named Entity Recognition e come ti aggancia a un nodo univoco tramite Wikidata. Il riconoscimento è solo la porta d’ingresso. Quello che succede dopo — il fatto che l’AI ti citi in modo denso e convincente — dipende da quanti attributi ha a disposizione per “raccontarti”.

Un’entità con 3 attributi (nome, città, settore generico) produce risposte vaghe: “c’è anche Cantiere X a La Spezia”. Un’entità con 20 attributi produce risposte dense: “Cantiere X, fondato nel 1987 a La Spezia, specializzato in refitting di motor yacht fino a 50 metri, con certificazione RINA”. Indovina quale delle due spinge l’utente a cliccare.

Qui agisce lo stesso meccanismo di embedding e spazio vettoriale che ti ho descritto: più contesto il modello ha sull’entità, più vicino finisce il tuo brand a query specifiche (“refitting megayacht Liguria”, “cantiere certificato RINA La Spezia”), non solo a query generiche.

Pro tip

Schema markup Organization sulla homepage (campi foundingDate, founder, address, award, knowsAbout, sameAs)

Il test che puoi fare in dieci minuti

Serve una prova concreta di quanto sia ricca la tua entità agli occhi dell’AI. Fai questo:

Apri il Rich Results Test di Google, incolla l’URL della tua homepage, cerca la voce “Organization” nell’output. Conta gli attributi popolati: name, url, logo, foundingDate, founder, address, sameAs, award, knowsAbout, description. Se ne hai meno di 7, la tua entità è scheletrica.
Vai su Wikidata, cerca il nome del brand. Se non hai una voce, la tua entità non esiste nel grafo aperto. Se ce l’hai, conta le proprietà (P17 paese, P571 data fondazione, P159 sede, P452 settore, P1448 nome ufficiale, P856 sito). Meno di 10 proprietà è poco.
Apri ChatGPT o Perplexity e chiedi “parlami di [nome brand]”. Se la risposta è di tre righe e contiene solo dati ovvi (settore, città), sei al livello base. Se include fondatore, anno, specializzazioni specifiche, partnership, sei già sopra la media.

La soglia binaria: sotto 10 attributi verificabili tra schema + Wikidata, sei povero. Sopra 15, cominci a essere cibo interessante per il modello.

Il reverse engineering che ho fatto sui cantieri liguri

Ho provato tre query diverse su Perplexity, tutte sul settore nautico ligure, per capire cosa citano davvero i motori AI quando un utente cerca:

“migliori cantieri di refitting yacht in Italia”
“cantieri navali La Spezia refitting motor yacht”
“aziende refit megayacht Liguria”

Su nove cantieri citati in totale, tra Genova e La Spezia, ho controllato due cose: la scheda Organization via schema markup sulla loro homepage e la presenza della voce Wikidata.

Il pattern che ho visto: i tre cantieri citati in cima alle risposte avevano mediamente 12-15 attributi compilati tra schema e Wikidata, più profili LinkedIn aziendali con descrizione ricca e directory di settore (Superyachttimes, Boat International) con pagine dedicate. I sei cantieri citati in coda — o solo come elenco — avevano meno di 6 attributi, spesso senza voce Wikidata del tutto.

Due disclaimer onesti: il campione è piccolo e le query cambiano risposta nel tempo. Non è uno studio, è un test indicativo. L’analisi vera la fai con strumenti professionali che tracciano le citazioni AI su centinaia di query nel settore e aggregano i pattern su mesi. Ma la direzione è chiara: chi ha attributi, viene citato con dettaglio. Chi non li ha, viene nominato e dimenticato.

Gli errori che vedo più spesso

Quando analizzo l’entità di una PMI italiana, incontro quasi sempre gli stessi quattro pattern.

Attributi solo sul sito, zero su Wikidata e profili esterni. Il cantiere ha una bella pagina “chi siamo” con fondatore, storia, premi. Ma nulla di tutto questo esiste fuori dal suo dominio. Il modello vede un’unica fonte, la scarta come autoreferenziale.

Schema Organization scarno. Solo name, url, logo. Niente foundingDate, niente sameAs, niente award. È il 70% dei casi che vedo nei settori nautico e artigianale: il sito è bello, lo schema è il minimo sindacale fatto dal plugin WordPress di default.

Incoerenza tra fonti. Sul sito la sede è “La Spezia”, su LinkedIn è “Lerici”, su Wikidata (se c’è) è “Liguria”. Il modello riceve tre segnali diversi e considera l’entità poco affidabile.

Attributi genericoni. “Settore: nautica”. Inutile. Il modello vuole “refitting di motor yacht tra 30 e 50 metri, specializzato in impianti elettrici e carpenteria inox”. La specificità è un attributo in sé.

Cosa fare concretamente per il tuo brand

Per ogni attributo chiave del tuo brand (fondatore, anno di fondazione, sede esatta, prodotti/servizi principali, certificazioni, premi, partnership) controlla che sia presente in tre posti:

Schema markup Organization sulla homepage (campi foundingDate, founder, address, award, knowsAbout, sameAs)
Scheda Wikidata con proprietà popolate (se non ce l’hai, creala o falla creare da qualcuno con esperienza editoriale su Wikidata — non è banale)
Profili esterni coerenti: LinkedIn aziendale, Google Business Profile, directory di settore autorevoli (per i cantieri nautici: Superyachttimes, Boat International, RINA register)

Confronta con i 3-5 cantieri che l’AI cita per primi nelle query del tuo settore. Conta quanti attributi hanno loro e quanti ne hai tu. La differenza è esattamente la distanza che ti separa dalla citazione in cima.

La visibilità nelle risposte AI passa da qui

Ti ho detto all’inizio che la differenza tra un’entità “grassa” e una “scheletrica” decide se l’AI ti cita con dettaglio o ti lascia nell’ombra. Il principio documentato dalla ricerca sul Knowledge Graph lo conferma: i sistemi di arricchimento automatico lavorano su quello che trovano in rete, e se non trovano attributi coerenti su di te, non possono inventarseli — anzi, scartano i segnali contraddittori.

La visibilità nelle risposte AI non è un interruttore. È un cumulo progressivo di attributi verificabili che il modello raccoglie su di te. Ogni proprietà che aggiungi a Wikidata, ogni campo che popoli nello schema, ogni menzione coerente in directory di settore, è un pezzo in più che il modello userà quando parlerà del tuo brand.

Nei prossimi articoli della serie entrerò nel dettaglio di schema Organization completo, di come costruire una mappa di relazioni entità-entità, e di come fare un audit periodico dell’entità per tenere il profilo sempre ricco. Sono i passi operativi che rendono concreto quello che ti ho raccontato qui.

Capitolo 4 · Esistere come entità, non come pagina

Prosegui la lettura degli approfondimenti

40 approfondimenti, divisi nelle 5 sezioni del capitolo.

4.1 Entity Recognition 8 approfondimenti

Brand nuovo e invisibile nelle risposte AI: come accelerare il riconoscimento Il tuo brand in italiano e in inglese sono la stessa entità per l’AI? Probabilmente no Quando l’AI non capisce più che “noi” sei tu: il problema della coreference Entity Linking: perché 50 menzioni del tuo brand valgono zero se l’AI non le collega Il tuo brand compare nelle risposte AI, ma come ti classifica? Entity salience: perché essere nominato una volta è come non essere nominato Entity disambiguation: quando l’AI confonde il tuo brand con un omonimo Named Entity Recognition: come l’AI decide se il tuo brand è “qualcuno” o solo testo

4.2 Knowledge Graph Optimization 8 approfondimenti

Product Entity vs Brand Entity: perché l’AI può conoscere il tuo nome senza sapere cosa vendi Rich Entity Attributes: perché l’AI cita con dettaglio solo le entità “grasse” Sei qui Quando l’AI trova tre versioni diverse della tua azienda, smette di consigliarti Il codice fiscale del tuo brand nell’ecosistema AI sameAs: il collante che tiene insieme la tua identità per l’AI Schema Organization completo: la carta d’identità machine-readable del tuo brand Wikidata come backbone semantico: la voce che fa esistere il tuo brand per l’AI Entrare nel Knowledge Graph di Google: perché senza sei solo testo per Gemini

4.3 Entity Relationships 8 approfondimenti

Client Portfolio come Entity Network: perché i tuoi clienti sono nodi che ti rafforzano Alumni & Affiliation Network: le tue connessioni istituzionali nel grafo dell’AI Eventi come speaker: perché ogni conferenza è un nodo di autorità per l’AI Supply Chain Entity Mapping: come i partner dicono all’AI chi sei Industry Vertical Classification: la categoria che ti rende visibile (o invisibile) nelle risposte AI Associazione entità-luogo: perché Perplexity sa chi consigliare in Sardegna (e tu forse no) Competitor Entity Graph: perché l’AI cita sempre gli stessi 4-5 brand del tuo settore L’AI non ti cita da solo: ti cita dentro una rete di relazioni

4.4 Entità Verticali & Locali 8 approfondimenti

Product/Service Schema per Query Transazionali Directory verticali di settore: perché l’AI pesca da lì le sue raccomandazioni Professional Registry Entity: perché l’Albo è la tua prova di esistenza per l’AI Franchise e multi-location: perché l’AI non somma l’autorità delle tue sedi Perché l’AI raccomanda blog generalisti al posto del tuo studio medico (e come si ribalta) Chi è il dentista di Cagliari secondo ChatGPT? La risposta dipende dal Knowledge Graph della tua città NAP Consistency: perché l’AI ti manda clienti al numero sbagliato Google Business Profile come entità primaria: perché l’AI ti guarda da lì prima che dal sito

4.5 Entity Monitoring & Manutenzione 8 approfondimenti

Entity recovery dopo una crisi reputazionale: come ripulire la tua entità nel Knowledge Graph Entity Decay: perché l’AI smette di citarti (e come rientrare nelle risposte) Il tuo brand esiste in quattro versioni parallele (e non lo sai) Entity Confidence Testing: leggere il linguaggio dell’AI per capire quanto si fida del tuo brand Training Data Lifecycle: perché le correzioni al tuo sito non arrivano subito nell’AI Knowledge Graph Poisoning Prevention: come proteggere la tua entità da informazioni false che l’AI prende per vere AI Response Monitoring per Entity: come scoprire se l’AI racconta il tuo brand con i dati giusti Entity Audit Periodico: perché i tuoi dati invecchiano anche quando non te ne accorgi

L'autore

Roberto Serra al Senato della Repubblica

Senato della Repubblica · Palazzo Giustiniani Convegno “Il potere dell'intelligenza artificiale”

Roberto Serra

Consulente SEO da oltre 15 anni, fondatore dell'Agenzia SEO Serra (RAANK). Aiuta multinazionali e PMI a restare visibili dove la ricerca si sta spostando: ChatGPT, Perplexity, Gemini e gli AI Overviews di Google.

Ne hanno parlato

Scopri di più su Roberto Serra →