Scrivere contenuti che l'AI riesce a citare

Le tue informazioni chiave sono solo nel testo? Con JSON-LD l’AI le legge senza errori

Roberto Serra 13 Aprile 2026·~8 min di lettura

I tuoi prezzi, le FAQ, il catalogo sono sepolti nel testo della pagina? L'AI deve estrarli leggendo, e spesso sbaglia o li ignora del tutto — il che significa clienti che ricevono informazioni sbagliate o incomplete sul tuo conto. Esiste un formato tecnico che consegna quei dati all'AI già pronti, senza margine di errore. Chi lo adotta viene citato con precisione, guadagna credibilità e trasforma ogni risposta dell'AI in un canale di acquisizione affidabile.

Hai una pagina prodotto con prezzo, disponibilità, rating medio, specifiche tecniche. Tutte sparse tra paragrafi, tabelle, sidebar. Un visitatore umano le trova perché ha gli occhi e il contesto. Un sistema AI che processa quella pagina come testo piatto deve prima capire dove sono i dati, poi estrarre il valore, poi verificare che sia aggiornato. Tre passaggi, tre possibilità di errore.

JSON-LD elimina quei tre passaggi. È un blocco di codice invisibile al visitatore, perfettamente leggibile per qualsiasi parser, dove ogni dato è etichettato, tipizzato e associato a un’entità precisa. Prezzo: 149 euro. Valuta: EUR. Disponibilità: InStock. Zero ambiguità, zero interpretazione.

Come funziona JSON-LD e perché è diverso dal testo

JSON-LD sta per JavaScript Object Notation for Linked Data. In pratica, è un blocco ` inserito nell’head o nel body della pagina.

La differenza rispetto al testo è sostanziale. Quando scrivi “Il nostro servizio di consulenza costa 1.500 euro a giornata”, il dato è annegato nella sintassi. Un parser deve fare analisi del linguaggio naturale per estrarre il numero e associarlo al servizio menzionato due righe sopra. Con JSON-LD, quella stessa informazione diventa:

“json { “@type”: “Service”, “name”: “Consulenza strategica AI”, “offers”: { “price”: “1500”, “priceCurrency”: “EUR” } } “

Il dato è già nel formato che il sistema consuma. È questo non vale solo per Google e Bing — vale per qualsiasi pipeline che sappia leggere dati strutturati.

Il punto critico: i sistemi RAG non leggono JSON-LD

Qui devo essere onesto, perché su questo tema c’è molta confusione. JSON-LD è potentissimo per i motori di ricerca tradizionali e per i knowledge graph. Ma la maggior parte dei sistemi RAG che alimentano i motori AI generativi non lo processa.

Lo studio di Volpini et al. (2026) sui dati strutturati collegati come layer di memoria per il retrieval lo documenta in modo esplicito:

“However, JSON-LD markup remains valuable for search engines with dedicated parsers (Google, Bing), but it provides no measurable benefit in RAG-based systems that treat pages as flat text.”
(Structured Linked Data as a Memory Layer for Agent-Orchestrated Retrieval)

Fermati su questo passaggio. Non dice che JSON-LD è inutile — dice che non produce benefici misurabili nei sistemi RAG che trattano le pagine come testo piatto. È questa è una distinzione fondamentale, perché ti dice esattamente dove JSON-LD funziona e dove no, e di conseguenza come devi usarlo.

I motori di ricerca tradizionali — Google, Bing — hanno parser dedicati che leggono il blocco JSON-LD, lo interpretano e lo usano per i rich snippet, per il Knowledge Panel, per le risposte dirette. Quando Google mostra il prezzo del tuo prodotto direttamente nei risultati di ricerca, sta leggendo il tuo JSON-LD. E quando i motori AI attingono dai risultati di Google per costruire le loro risposte — cosa che accade regolarmente — quel dato strutturato arriva indirettamente anche a loro.

Errore comune

Un campo compilato con dati inventati è peggio di un campo vuoto, perché i sistemi di verifica incrociano le informazioni e penalizzano le incongruenze.

La strategia doppia: JSON-LD più testo strutturato

Da questa evidenza segue un approccio operativo preciso. Non devi scegliere tra JSON-LD e testo ben strutturato. Devi usarli entrambi, ciascuno per quello che sa fare meglio.

JSON-LD per i parser dedicati. Google, Bing e i sistemi che leggono i dati strutturati ricevono le tue informazioni in formato machine-parsable, senza ambiguità. Questo alimenta i knowledge graph, i rich snippet e — indirettamente — le risposte AI che attingono da queste fonti.

Testo strutturato per i sistemi RAG. I crawler che processano la pagina come testo piatto — e sono la maggioranza delle pipeline AI generative — hanno bisogno che le stesse informazioni siano presenti nel corpo della pagina in formato leggibile. Ne ho parlato a fondo nell’articolo sulle tabelle HTML come chunk strutturato: una tabella con header chiari e valori testuali è il formato più efficace per rendere i dati estraibili dal retrieval.

Nel survey di Gao et al. (2024) sui sistemi RAG, la distinzione tra fonti di dati è netta:

“Structured data, such as knowledge graphs (KGs), which are typically verified and can provide more precise information.”
(Retrieval-Augmented Generation for Large Language Models: A Survey)

I dati strutturati sono tipicamente verificati e forniscono informazioni più precise. JSON-LD alimenta esattamente quei knowledge graph. Ogni volta che dichiari un’entità Product, Service o LocalBusiness con i campi corretti, stai contribuendo alla base di conoscenza strutturata da cui i motori AI attingono per dare risposte precise.

Pro tip

Per ognuno di questi schemi, la regola è una: compila tutti i campi per cui hai dati reali.

Quali schemi implementare e con quali campi

Non tutti gli schemi JSON-LD hanno lo stesso impatto. Tre tipologie coprono la stragrande maggioranza dei casi d’uso per un’azienda che vuole essere visibile nelle risposte AI.

Product. Se vendi prodotti, ogni pagina prodotto dovrebbe avere uno schema Product con: name, description, brand, offers (con price, priceCurrency, availability), aggregateRating (se hai recensioni), image, sku. Questi sono i campi che Google legge per i rich snippet e che alimentano le risposte a query tipo “quanto costa X” o “X è disponibile?”.

Service. Se offri servizi, lo schema Service ti permette di dichiarare: name, description, provider (la tua azienda), areaServed, serviceType. Aggiungi offers se hai un pricing definito. Questo schema è meno diffuso di Product, il che significa meno concorrenza — e più probabilità che i tuoi dati emergano quando qualcuno chiede “chi offre il servizio Y nella zona Z”.

LocalBusiness. Per qualsiasi attività con una sede fisica o un’area di servizio definita: name, address, telephone, openingHours, geo (coordinate), sameAs (link ai profili social e directory). Questo schema dialoga direttamente con Google Business Profile e con i knowledge graph locali — una miniera per chi vuole comparire nelle risposte a query geolocalizzate.

Per ognuno di questi schemi, la regola è una: compila tutti i campi per cui hai dati reali. Un campo compilato con dati inventati è peggio di un campo vuoto, perché i sistemi di verifica incrociano le informazioni e penalizzano le incongruenze.

L’errore che vedo più spesso

L’errore non è “non ho JSON-LD”. L’errore è “ho JSON-LD ma è incompleto o scollegato dal contenuto della pagina”.

Ho analizzato decine di siti di aziende italiane. La situazione tipica: uno schema Organization nel footer del sito, uguale su tutte le pagine, con nome e logo. Stop. Nessuno schema Product sulle pagine prodotto. Nessuno schema Service sulle pagine servizio. A volte uno schema FAQ implementato dal plugin SEO ma con domande generiche che non corrispondono a nessun contenuto reale della pagina.

Il secondo errore è la discrasia tra JSON-LD e testo. Se il tuo JSON-LD dichiara un prezzo di 149 euro ma nella pagina il prezzo visibile è 159 euro (magari perché hai aggiornato uno e non l’altro), il sistema di verifica rileva l’incongruenza. Il risultato: il dato non viene usato perché non è affidabile.

Lo stesso survey lo ribadisce: il testo non strutturato resta la fonte di retrieval più utilizzata:

“Unstructured Data, such as text, is the most widely used retrieval source, which are mainly gathered from corpus.”
(Retrieval-Augmented Generation for Large Language Models: A Survey)

Se il testo della pagina è la fonte primaria per i sistemi RAG, allora JSON-LD da solo non basta. Ma se aggiungi JSON-LD al testo strutturato, copri entrambi i canali: i parser dedicati e il retrieval testuale. E chi copre entrambi i canali ha un vantaggio su chi ne copre solo uno.

Un check di partenza sulle tue pagine

Apri una pagina chiave del tuo sito — quella del prodotto di punta o del servizio principale. Vai su Google Rich Results Test e incolla l’URL. Se il tool non rileva nessuno schema, il primo passo è implementarlo. Se rileva uno schema generico (solo Organization), il passo è aggiungere gli schemi specifici per il tipo di contenuto.

Poi confronta i dati nel JSON-LD con quelli visibili nella pagina. Prezzo, disponibilità, nome del prodotto, rating: devono coincidere. Una discrepanza è un problema che puoi risolvere in dieci minuti e che potrebbe star bloccando la citazione dei tuoi dati.

È un controllo di superficie, naturalmente. Per capire come i crawler AI stanno processando le tue pagine e se i tuoi dati strutturati arrivano fino alle risposte servono strumenti più profondi. Ma questo check ti dice già se stai giocando la partita o se sei seduto in tribuna.

Se vuoi approfondire gli altri formati che rendono i tuoi contenuti citabili dalle pipeline AI, nell’articolo sullo schema FAQ, HowTo e Article ti spiego come questi schemi dialogano direttamente con i motori AI. In quello sulle citazioni e bibliografia in-content trovi il formato che l’AI riconosce e riproduce quasi letteralmente. E se stai pensando a come trasformare i tuoi contenuti migliori in asset autonomi, ho scritto un approfondimento sui contenuti downloadable come segnale di authority.

Ogni dato che oggi è sepolto nel testo senza un’etichetta machine-readable è visibilità che stai regalando a chi quell’etichetta l’ha messa. JSON-LD più testo strutturato è la combinazione che copre tutti i canali — quelli di oggi e quelli di domani.

Capitolo 3 · Scrivere contenuti che l'AI riesce a citare

Prosegui la lettura degli approfondimenti

39 approfondimenti, divisi nelle 5 sezioni del capitolo.

3.1 Architettura della Pagina 8 approfondimenti

La tua sidebar sta inquinando il contenuto che l’AI estrae Vuoi che l’AI citi il tuo articolo? Dagli un TL;DR da copiare L’AI non sa dove si trova la tua pagina senza le breadcrumb Stai sprecando il primo viewport della tua pagina con un banner decorativo Il tuo articolo non ha un sommario? L’AI sta cercando le risposte al buio L’AI non legge i tuoi titoli generici: li ignora Ogni sezione della tua pagina deve essere un mini-articolo che l’AI può citare da solo Se la risposta è al paragrafo 8 l’AI non la troverà mai

3.2 Pattern di Risposta 8 approfondimenti

I tuoi contenuti non hanno un numero? L’AI li considera meno affidabili Parli solo dei vantaggi? L’AI ti classifica come promozionale Le tue liste sono random? L’AI le ignora e cita chi ha un criterio chiaro Se il tuo settore ha coppie da confrontare e tu non lo fai l’AI cita qualcun altro L’AI cerca la frase ‘X è…’ nella tua pagina e se non la trova passa oltre I tuoi contenuti spiegano il ‘cosa’ ma non il ‘perché’? L’AI li ignora Le tue guide sono un muro di testo? L’AI non riesce a estrarle come risposta Le tue FAQ hanno risposte di una riga? Per l’AI sono inutilizzabili

3.3 Formati Citabili 7 approfondimenti

Hai solo guide evergreen? Stai perdendo le citazioni sulle novità di settore I tuoi contenuti migliori esistono solo come pagine web? In PDF diventano asset autonomi Le tue informazioni chiave sono solo nel testo? Con JSON-LD l’AI le legge senza errori Sei qui Citi le tue fonti? L’AI ti tratta come una risorsa di livello superiore Lo schema markup non è solo per Google: l’AI lo usa come riassunto pronto I tuoi confronti sono scritti in prosa? In tabella sarebbero 10 volte più citabili Le informazioni chiave sono nel testo normale? Con un callout l’AI le estrae prima

3.4 Contenuto Multimodale 8 approfondimenti

Le tue infografiche sono bellissime ma per l’AI non esistono Le tue didascalie dicono ‘Grafico vendite’? Con i numeri giusti diventano citabili Hai ore di video eccellenti? Senza trascrizione per l’AI non esistono Le tue infografiche hanno alt text come ‘grafico vendite’? Per l’AI non esistono Le show notes del tuo podcast sono una scaletta di tre righe? Stai sprecando un asset Vuoi che l’AI ti citi di più? Crea un tool che altri siti vogliono incorporare I tuoi video non hanno capitoli? L’AI non riesce a citare la parte giusta I tuoi flowchart sono immagini bellissime che l’AI non riesce a leggere

3.5 Linking & Contesto Semantico 8 approfondimenti

Il tuo sito ha buchi nella copertura? I competitor li riempiono e l’AI sceglie loro Metti link senza spiegare perché? L’AI non capisce la relazione I tuoi link dicono ‘clicca qui’? L’AI non capisce dove portano I tuoi link saltano da un tema all’altro? L’AI non percepisce competenza su nessuno La tua pagina più importante ha meno link interni di quella secondaria? L’AI si confonde Lo stesso contenuto esiste su tre URL diversi? L’AI non sa quale scegliere I tuoi contenuti sono pagine isolate? Il modello hub e spoke li organizza per l’AI I tuoi articoli correlati li sceglie un algoritmo? Per l’AI non valgono quasi niente

L'autore

Roberto Serra al Senato della Repubblica

Senato della Repubblica · Palazzo Giustiniani Convegno “Il potere dell'intelligenza artificiale”

Roberto Serra

Consulente SEO da oltre 15 anni, fondatore dell'Agenzia SEO Serra (RAANK). Aiuta multinazionali e PMI a restare visibili dove la ricerca si sta spostando: ChatGPT, Perplexity, Gemini e gli AI Overviews di Google.

Ne hanno parlato

Scopri di più su Roberto Serra →