Diventare una fonte di cui l'AI si fida

I dati strutturati sono la carta d’identità del tuo sito per l’AI

Roberto Serra 13 Aprile 2026·~10 min di lettura

Se il tuo sito non ha una carta d’identità digitale leggibile dalle macchine, l’AI deve indovinare chi sei, cosa fai e dove operi — e quando si sbaglia, il tuo potenziale cliente riceve informazioni errate sul tuo conto. Nel frattempo, chi ha reso quelle stesse informazioni immediatamente leggibili viene citato al posto tuo. Esistono istruzioni standard — dati strutturati — che dicono all’AI esattamente cosa sei, senza margini di errore. Si installano una volta sola e lavorano per te su ogni pagina del sito.

C’è una convinzione diffusa tra chi lavora con schema.org: aggiungi il markup JSON-LD, Google mostra il rich snippet, fine della storia. Per anni ha funzionato così. Il dato strutturato era un bonus cosmetico — la stellina nelle SERP, il prezzo nel risultato, il breadcrumb sotto il titolo.

Ma adesso la partita si gioca su un campo diverso. I modelli AI che alimentano le risposte di ChatGPT, Perplexity e Gemini non cercano rich snippet. Cercano informazioni verificabili, machine-readable, che possano usare per decidere se fidarsi di una fonte. E qui i dati strutturati entrano in gioco in un modo che nella mia pratica professionale ho visto pochissimi considerare — e con un paradosso che ti spiego partendo dai dati.

Il paradosso del JSON-LD: utile ma non come pensi

Partiamo dal dato che rompe lo schema mentale di chi lavora con il markup. Un paper del 2026 di Volpini et al. ha analizzato l’impatto reale dei dati strutturati sui sistemi RAG — quelli che cercano informazioni in tempo reale prima di generare una risposta:

“JSON-LD markup remains valuable for search engines with dedicated parsers (Google, Bing), but it provides no measurable benefit in RAG-based systems that treat pages as flat text.”

Volpini et al., 2026

Fermati un secondo su questo. JSON-LD, il formato che usiamo per implementare schema.org, non produce benefici misurabili nei sistemi RAG che trattano le pagine come testo piatto. E la maggior parte dei sistemi RAG fa esattamente questo: prende la tua pagina, la converte in testo, la processa.

Se stai pensando “allora i dati strutturati non servono a nulla per l’AI”, la conclusione è sbagliata. È lo stesso paper a spiegare perché. Ma prima serve capire cosa vedono davvero i sistemi AI quando visitano il tuo sito.

I sistemi di intelligenza artificiale premiano la struttura, la chiarezza e l’allineamento fattuale. Questo è esattamente il tipo di lavoro che i buoni SEO hanno sempre fatto. La differenza è che ora il “pubblico” include le macchine.

Se stai ottimizzando per il recupero delle informazioni e l’affidabilità, anziché per il posizionamento e i click, stai comunque facendo SEO. Lo stai solo facendo per un nuovo livello di ricerca, più profondo e interconnesso.
Duane Forrester, AI Search strategist, su SEO Confidential

Cosa vede l’AI: testo, non markup

L’analisi di Gao et al. del 2024, uno dei riferimenti più completi sui sistemi RAG, chiarisce un punto fondamentale sulla fonte dei dati:

“Unstructured Data, such as text, is the most widely used retrieval source.”

Gao et al., 2024

Il testo non strutturato è la fonte di recupero più usata. Non il JSON-LD, non il markup schema.org, non i knowledge graph. Testo. Paragrafi, frasi, parole in sequenza.

Questo significa che quando un sistema RAG crawla la tua pagina per decidere se usarla come fonte in una risposta, nella stragrande maggioranza dei casi sta leggendo il testo visibile. Il blocco JSON-LD che hai inserito nell’head della pagina — quello con Organization, Person, i tuoi dati aziendali — è invisibile per quel sistema. È lì, nel codice, ma non viene processato come fonte di recupero.

Ora, la domanda diventa: se il RAG legge solo il testo, a cosa serve il dato strutturato?

Errore comune

L’errore che vedo più spesso è esattamente questo: siti con uno schema.org tecnicamente impeccabile, validato senza errori, ma con pagine che non espongono quelle informazioni in testo leggibile.

La svolta: materializzare i dati strutturati nel testo

Qui arriva l’insight che cambia la strategia. Lo stesso paper di Volpini et al. ha testato un approccio diverso: invece di lasciare i dati strutturati sepolti nel JSON-LD, li hanno materializzati in pagine leggibili — le chiamano “enhanced entity pages”. Pagine dove le informazioni dello schema (chi sei, cosa fai, dove sei, quali relazioni hai con altre entità) vengono esposte come testo strutturato e leggibile.

Il risultato:

“Enhanced pages achieved +29.6% accuracy improvement for standard RAG.”

Volpini et al., 2026

Più 29.6% di accuratezza. Non visibilità, non ranking — accuratezza. Il sistema RAG, quando trova una pagina che presenta i dati strutturati in formato leggibile, produce risposte più corrette. E una risposta più corretta è una risposta più probabile — i sistemi tendono a preferire fonti che riducono l’incertezza.

La differenza tra il JSON-LD nascosto e la pagina enhanced è esattamente questa: nel primo caso le informazioni esistono ma l’AI non le vede; nel secondo caso le informazioni sono nel testo, nel flusso che il sistema processa, e diventano parte della risposta.

Pro tip

Il principio è semplice: tutto ciò che metti nel JSON-LD deve esistere anche nel testo.

La doppia strategia: parser e RAG

Questo non significa che devi abbandonare il JSON-LD. Significa che devi giocare su due tavoli contemporaneamente.

Il primo tavolo è quello dei motori di ricerca tradizionali. Google e Bing hanno parser dedicati per JSON-LD. Leggono il tuo schema Organization, il tuo schema Person, le tue FAQ markup, e li usano per alimentare il Knowledge Graph, mostrare rich snippet, validare la tua entità. Per questo canale, il JSON-LD continua a funzionare esattamente come prima — e se hai già un Knowledge Panel, è in parte grazie a quello.

Il secondo tavolo è quello dell’AI generativa. Qui il JSON-LD da solo non basta. Servono pagine che rendano esplicite, in testo leggibile, le informazioni che normalmente nascondi nel markup. Chi sei, cosa fa la tua azienda, quali sono i tuoi servizi, chi sono le persone chiave, quali certificazioni hai, dove operi.

In pratica: se il tuo schema Organization dice ”name”: “Azienda X”, “foundingDate”: “2010”, “areaServed”: “Italia”, queste informazioni devono esistere anche come testo visibile sulla tua pagina About. Non perché Google ne abbia bisogno — quello le legge dal JSON-LD. Ma perché l’AI generativa legge il testo.

Cosa implementare: dal markup al contenuto

La strategia si divide in due livelli. Il primo è quello che probabilmente stai già facendo (o dovresti): implementare schema.org in JSON-LD sulle pagine chiave del sito.

Ma il secondo livello è quello che fa la differenza per l’AI, e quasi nessuno lo sta facendo: creare pagine che materializzano quei dati in contenuto leggibile.

Ecco cosa significa in pratica. Se hai implementato schema Organization con i tuoi dati aziendali, la tua pagina About deve contenere quelle stesse informazioni in formato discorsivo — non un elenco puntato secco, ma testo che un sistema RAG può estrarre e usare come fonte. Se hai schema Person per i tuoi autori, ogni autore deve avere una pagina profilo che espone competenze, esperienze e affiliazioni in testo leggibile. Se hai schema FAQ, le domande e risposte devono essere presenti nella pagina come contenuto visibile, non solo nel markup.

Il principio è semplice: tutto ciò che metti nel JSON-LD deve esistere anche nel testo. Il JSON-LD parla ai parser di Google e Bing. Il testo parla all’AI generativa. Se hai solo il primo, stai parlando a metà del pubblico.

Lo schema Organization dovrebbe essere il primo passo: nome ufficiale, URL, logo, collegamenti sameAs, informazioni di contatto, fondatori o figure chiave quando pertinenti e la categoria più accurata dell’azienda.

Schema.org sta diventando fondamentale perché il percorso dell’utente è sempre più mediato prima ancora del click.
I motori di risposta basati sull’intelligenza artificiale, gli agenti AI, le API, i protocolli MCP e i sistemi di retrieval hanno bisogno di dati puliti e strutturati per capire quale azienda esiste, cosa offre, quali informazioni sono affidabili e perché dovrebbe comparire in una determinata risposta.
Più sono chiare le entità, le relazioni, la provenienza delle informazioni e il loro aggiornamento, più sarà semplice per le macchine identificare e considerare affidabile una fonte.

Lo schema Organization definisce l’azienda, Product e Offer descrivono ciò che viene venduto, Service identifica i servizi offerti, Person e Article collegano le competenze ai contenuti, BreadcrumbList e ItemList rendono più chiara l’architettura del sito, mentre i collegamenti sameAs connettono il brand alla sua identità distribuita sul web.

Questi markup aiutano i motori di risposta a passare da un’interpretazione frammentata delle singole pagine a una rappresentazione molto più ordinata e coerente della conoscenza relativa all’azienda.
Emilia Gjorgjevska, Ricercatrice ed esperta GEO, su SEO Confidential

L’errore più comune: markup senza contenuto

L’errore che vedo più spesso è esattamente questo: siti con uno schema.org tecnicamente impeccabile, validato senza errori, ma con pagine che non espongono quelle informazioni in testo leggibile.

Hanno il JSON-LD Organization completo nell’head, ma la pagina About è tre righe generiche. Hanno schema Person per ogni autore, ma le pagine autore sono stub con nome e foto. Hanno FAQ markup, ma le FAQ esistono solo nel codice, non nella pagina.

Per Google, funziona. Il parser legge il JSON-LD e ignora il testo. Per l’AI generativa, è come avere una carta d’identità in una cassaforte chiusa: esiste, ma nessuno la vede.

Un check rapido che puoi fare subito: prendi le tre pagine più importanti del tuo sito. Guarda il JSON-LD implementato. Poi guarda il testo visibile della pagina. Le informazioni coincidono? Il testo contiene tutto ciò che il markup dichiara? Se ci sono gap, quelli sono i punti dove l’AI perde informazioni su di te. È un primo passo per capire dove stai — l’implementazione completa richiede un lavoro sistematico su architettura delle pagine e struttura dei contenuti.

Google ha affermato chiaramente nelle proprie linee guida sull’ottimizzazione per l’IA che i dati strutturati non sono necessari per la ricerca con IA generativa e che non esiste uno schema specifico da aggiungere a tale scopo.
Continua a raccomandare l’uso dello schema, ma per l’idoneità ai risultati arricchiti nell’ambito della normale SEO, non come “trucco” per ottenere citazioni.

Il vero valore dello schema sta nella disambiguazione e nell’analisi automatica. Aiuta un sistema a capire che cos’è un’entità, quanto costa un prodotto, chi è un autore. Ciò contribuisce alla chiarezza delle entità, cosa a cui tengo molto.
Ma la qualità dei contenuti, la crawlability e l’autorevolezza del marchio fanno il lavoro più pesante e superano di gran lunga lo schema.

La mia regola empirica è che lo schema sia il tocco finale che rende i buoni contenuti leggibili alle macchine. Non trasforma contenuti deboli in una fonte citata, e non dovresti investirci aspettandoti un aumento delle citazioni solo grazie ad esso.
Jan-Willem Bobbink, consulente SEO, su SEO Confidential

Perché questo è un vantaggio competitivo

La buona notizia è che quasi nessuno sta facendo questa doppia implementazione. La maggior parte dei siti che ha schema.org si è fermata al primo livello — il markup tecnico. Pochissimi hanno capito che quel markup deve diventare contenuto.

Questo si collega direttamente a quello di cui ho parlato negli articoli sul peso delle menzioni implicite e sui backlink come segnale di citazione: la visibilità AI si costruisce su più livelli simultanei. I dati strutturati sono uno di quei livelli — ma solo se li rendi visibili a tutti i sistemi, non solo a Google.

Chi implementa la doppia strategia adesso — JSON-LD per i parser, contenuto materializzato per l’AI — sta costruendo un vantaggio che si consolida nel tempo. Più i sistemi RAG diventano la modalità dominante di ricerca, più quel +29.6% di accuratezza si traduce in visibilità concreta. È meccanica, non profezia: i sistemi preferiscono fonti che rendono le informazioni facilmente estraibili.

La topical authority si rafforza quando le tue pagine non solo parlano del tuo tema, ma lo fanno in un formato che l’AI può processare senza ambiguità. I dati strutturati materializzati nel testo sono esattamente questo: informazioni chiare, verificabili, pronte per essere estratte.