Rich Entity Attributes: perché l’AI cita con dettaglio solo le entità “grasse”

Chiedi a Perplexity i migliori cantieri di refitting yacht in Italia. I due o tre in cima hanno una cosa in comune: anno di fondazione, sede, tipo di interventi, certificazioni, premi. Gli altri vengono liquidati con "tra gli altri operano anche...". Non è questione di qualità dei servizi — è che il modello ha poco da dire sulle entità scheletriche, e quando ha poco da dire, cita di passaggio. L'AI non può vederti ricco se il web non ti descrive ricco in modo coerente. Attributi strutturati in schema, Wikidata e profili di settore non sono dettagli tecnici: sono la materia prima da cui le pipeline AI costruiscono la tua rappresentazione. Ti spiego quali attributi compilare e dove.

Chiedi a Perplexity “migliori cantieri di refitting yacht in Italia”. Guarda la risposta. Le due o tre aziende citate in cima hanno un elemento in comune: descrizione ricca. Non una riga, non un claim generico. Anno di fondazione, sede, tipo di interventi (verniciatura, carpenteria, impianti), taglia delle unità trattate, premi o riconoscimenti, nomi dei cantieri partner.

Le altre — quelle che la risposta liquida con “tra gli altri cantieri operano anche…” — hanno profili scheletrici. Tre attributi, quattro al massimo. E il modello, non avendo nulla da dire, le cita al volo e passa oltre.

Questa è la differenza tra un’entità ricca di attributi e un’entità povera. Nei miei articoli della serie su Entity e Knowledge Graph ti ho spiegato cos’è un’entità, come viene disambiguata, come viene agganciata a Wikidata. Oggi ti mostro il meccanismo che decide se il modello ti cita con dettaglio o ti lascia nell’ombra: il numero e la qualità di attributi che l’AI riesce a recuperare sul tuo brand.

Cosa sono gli attributi di un’entità per un modello AI

Un’entità, per un LLM, non è un nome. È un nodo con tutto quello che ci sta attaccato. Se parliamo di un cantiere navale a La Spezia, gli attributi utili al modello sono: fondatore, anno di nascita, sede esatta, settore (refitting? costruzione ex novo? entrambi?), tipi di yacht trattati (sail, motor, megayacht), lunghezze massime dello scalo, certificazioni RINA o Lloyd’s, premi di settore, prodotti/servizi principali, partnership con designer o broker internazionali.

Più questi attributi sono presenti — e ripetuti in modo coerente tra schema markup sul sito, Wikidata, profili LinkedIn, directory di settore, articoli di stampa — più il modello “sa” di te. E più riempie la risposta con informazione utile quando qualcuno fa una query nel tuo settore.

Il principio documentato dalla ricerca sul Knowledge Graph

Nel mondo della ricerca sul Knowledge Graph, un filone recente si occupa di come arricchire automaticamente le entità di un grafo a partire dalla letteratura e dal web. Il paper KARMA di Jiang et al. (2025) descrive un framework multi-agente in cui diversi LLM specializzati leggono documenti, estraggono nuovi attributi, li verificano tra loro e poi li integrano nel grafo esistente. La logica dichiarata dagli autori è che la curazione manuale è affidabile ma non scala, mentre una pipeline automatica con controlli incrociati riesce a bilanciare accuratezza, coerenza e usabilità nell’arricchimento del grafo.

Da questo segue che i grandi grafi di conoscenza — quelli che alimentano gli LLM che rispondono a chi cerca “cantiere refitting yacht Liguria” — non vengono più popolati a mano. Vengono arricchiti da pipeline che leggono il web, estraggono attributi, li confrontano tra fonti multiple, e tengono solo quelli che passano i controlli di coerenza.

La conseguenza operativa per il tuo business è diretta: se il tuo brand non pubblica attributi in forma leggibile dalle macchine (schema markup, Wikidata, profili esterni strutturati), queste pipeline non hanno nulla da raccogliere su di te. E l’entità rimane scheletrica per sempre, perché nessuno la curerà più a mano.

Tradotto in pratica: il motore AI non può “vederti ricco” se il web non ti descrive ricco in modo coerente. E la coerenza tra fonti non è un accessorio, è il criterio principale di selezione.

Perché gli attributi ricchi stanno a monte della citazione AI

Negli articoli precedenti ti ho mostrato come il modello capisce che esisti grazie al Named Entity Recognition e come ti aggancia a un nodo univoco tramite Wikidata. Il riconoscimento è solo la porta d’ingresso. Quello che succede dopo — il fatto che l’AI ti citi in modo denso e convincente — dipende da quanti attributi ha a disposizione per “raccontarti”.

Un’entità con 3 attributi (nome, città, settore generico) produce risposte vaghe: “c’è anche Cantiere X a La Spezia”. Un’entità con 20 attributi produce risposte dense: “Cantiere X, fondato nel 1987 a La Spezia, specializzato in refitting di motor yacht fino a 50 metri, con certificazione RINA”. Indovina quale delle due spinge l’utente a cliccare.

Qui agisce lo stesso meccanismo di embedding e spazio vettoriale che ti ho spiegato nella serie P1: più contesto il modello ha sull’entità, più vicino finisce il tuo brand a query specifiche (“refitting megayacht Liguria”, “cantiere certificato RINA La Spezia”), non solo a query generiche.

Il test che puoi fare in dieci minuti

Serve una prova concreta di quanto sia ricca la tua entità agli occhi dell’AI. Fai questo:

  • Apri il Rich Results Test di Google, incolla l’URL della tua homepage, cerca la voce “Organization” nell’output. Conta gli attributi popolati: name, url, logo, foundingDate, founder, address, sameAs, award, knowsAbout, description. Se ne hai meno di 7, la tua entità è scheletrica.
  • Vai su Wikidata, cerca il nome del brand. Se non hai una voce, la tua entità non esiste nel grafo aperto. Se ce l’hai, conta le proprietà (P17 paese, P571 data fondazione, P159 sede, P452 settore, P1448 nome ufficiale, P856 sito). Meno di 10 proprietà è poco.
  • Apri ChatGPT o Perplexity e chiedi “parlami di [nome brand]”. Se la risposta è di tre righe e contiene solo dati ovvi (settore, città), sei al livello base. Se include fondatore, anno, specializzazioni specifiche, partnership, sei già sopra la media.

La soglia binaria: sotto 10 attributi verificabili tra schema + Wikidata, sei povero. Sopra 15, cominci a essere cibo interessante per il modello.

Il reverse engineering che ho fatto sui cantieri liguri

Ho provato tre query diverse su Perplexity, tutte sul settore nautico ligure, per capire cosa citano davvero i motori AI quando un utente cerca:

  • “migliori cantieri di refitting yacht in Italia”
  • “cantieri navali La Spezia refitting motor yacht”
  • “aziende refit megayacht Liguria”

Su nove cantieri citati in totale, tra Genova e La Spezia, ho controllato due cose: la scheda Organization via schema markup sulla loro homepage e la presenza della voce Wikidata.

Il pattern che ho visto: i tre cantieri citati in cima alle risposte avevano mediamente 12-15 attributi compilati tra schema e Wikidata, più profili LinkedIn aziendali con descrizione ricca e directory di settore (Superyachttimes, Boat International) con pagine dedicate. I sei cantieri citati in coda — o solo come elenco — avevano meno di 6 attributi, spesso senza voce Wikidata del tutto.

Due disclaimer onesti: il campione è piccolo e le query cambiano risposta nel tempo. Non è uno studio, è un test indicativo. L’analisi vera la fai con strumenti professionali che tracciano le citazioni AI su centinaia di query nel settore e aggregano i pattern su mesi. Ma la direzione è chiara: chi ha attributi, viene citato con dettaglio. Chi non li ha, viene nominato e dimenticato.

Gli errori che vedo più spesso

Quando analizzo l’entità di una PMI italiana, incontro quasi sempre gli stessi quattro pattern.

Attributi solo sul sito, zero su Wikidata e profili esterni. Il cantiere ha una bella pagina “chi siamo” con fondatore, storia, premi. Ma nulla di tutto questo esiste fuori dal suo dominio. Il modello vede un’unica fonte, la scarta come autoreferenziale.

Schema Organization scarno. Solo name, url, logo. Niente foundingDate, niente sameAs, niente award. È il 70% dei casi che vedo nei settori nautico e artigianale: il sito è bello, lo schema è il minimo sindacale fatto dal plugin WordPress di default.

Incoerenza tra fonti. Sul sito la sede è “La Spezia”, su LinkedIn è “Lerici”, su Wikidata (se c’è) è “Liguria”. Il modello riceve tre segnali diversi e considera l’entità poco affidabile. Questo collega al tema E-E-A-T per l’AI che ti ho spiegato nella serie P2: la coerenza tra fonti è un pezzo dell’autorevolezza, ed è proprio il criterio che — come emerge dalla ricerca di Jiang e colleghi — le pipeline automatiche usano per filtrare gli attributi veri da quelli rumorosi.

Attributi genericoni. “Settore: nautica”. Inutile. Il modello vuole “refitting di motor yacht tra 30 e 50 metri, specializzato in impianti elettrici e carpenteria inox”. La specificità è un attributo in sé.

Cosa fare concretamente per il tuo brand

Per ogni attributo chiave del tuo brand (fondatore, anno di fondazione, sede esatta, prodotti/servizi principali, certificazioni, premi, partnership) controlla che sia presente in tre posti:

  • Schema markup Organization sulla homepage (campi foundingDate, founder, address, award, knowsAbout, sameAs)
  • Scheda Wikidata con proprietà popolate (se non ce l’hai, creala o falla creare da qualcuno con esperienza editoriale su Wikidata — non è banale)
  • Profili esterni coerenti: LinkedIn aziendale, Google Business Profile, directory di settore autorevoli (per i cantieri nautici: Superyachttimes, Boat International, RINA register)

Confronta con i 3-5 cantieri che l’AI cita per primi nelle query del tuo settore. Conta quanti attributi hanno loro e quanti ne hai tu. La differenza è esattamente la distanza che ti separa dalla citazione in cima.

La visibilità nelle risposte AI passa da qui

Ti ho detto all’inizio che la differenza tra un’entità “grassa” e una “scheletrica” decide se l’AI ti cita con dettaglio o ti lascia nell’ombra. Il principio documentato dalla ricerca sul Knowledge Graph lo conferma: i sistemi di arricchimento automatico lavorano su quello che trovano in rete, e se non trovano attributi coerenti su di te, non possono inventarseli — anzi, scartano i segnali contraddittori.

La visibilità nelle risposte AI non è un interruttore. È un cumulo progressivo di attributi verificabili che il modello raccoglie su di te. Ogni proprietà che aggiungi a Wikidata, ogni campo che popoli nello schema, ogni menzione coerente in directory di settore, è un pezzo in più che il modello userà quando parlerà del tuo brand.

Nei prossimi articoli della serie entrerò nel dettaglio di schema Organization completo, di come costruire una mappa di relazioni entità-entità, e di come fare un audit periodico dell’entità per tenere il profilo sempre ricco. Sono i passi operativi che rendono concreto quello che ti ho raccontato qui.

Quanto è visibile il tuo brand per le AI?

Scoprilo in 30 secondi con il nostro tool gratuito. 11 check automatici, risultati immediati.

Roberto Serra

Mi chiamo Roberto Serra e sono un digital marketer con una forte passione per la SEO: Mi occupo di posizionamento sui motori di ricerca, strategia digitale e creazione di contenuti.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Quanto è visibile il tuo brand per le AI? Analizza il tuo brand