Scrivere contenuti che l'AI riesce a citare

Lo schema markup non è solo per Google: l’AI lo usa come riassunto pronto

Roberto Serra 13 Aprile 2026·~8 min di lettura

C'è un codice tecnico che funziona come un riassunto pre-confezionato per l'AI: invece di leggere e interpretare il tuo testo, il modello riceve i dati già pronti. Chi non ce l'ha rende il proprio contenuto più difficile da usare rispetto ai competitor che lo hanno già. Non è un intervento complicato: i tre elementi che contano davvero si configurano in mezza giornata — e la differenza in termini di citabilità si vede.

Hai implementato lo schema FAQPage sulle tue pagine FAQ. Hai aggiunto il markup Article con autore, data di pubblicazione e dateModified. Magari hai persino un HowTo schema sulle guide passo-passo. Ottimo per i rich snippet di Google. Ma se pensi che il lavoro finisca lì, ti stai perdendo metà della partita.

I motori AI generativi — quelli che producono risposte sintetizzate citando le fonti — non processano le pagine come Google. Non hanno un parser dedicato per JSON-LD. Eppure lo schema markup ti dà un vantaggio competitivo enorme anche con loro, per un motivo che non ha niente a che fare con i rich snippet. Te lo spiego partendo da un dato che forse non ti aspetti.

Il paradosso dello schema nei sistemi RAG

Nel mondo della ricerca, il rapporto tra dati strutturati e sistemi RAG è stato analizzato in modo diretto. Un passaggio del paper di Andrea Volpini et al. (2026) lo mette in chiaro:

However, JSON-LD markup remains valuable for search engines with dedicated parsers (Google, Bing), but it provides no measurable benefit in RAG-based systems that treat pages as flat text.
(Structured Linked Data as a Memory Layer for Agent-Orchestrated Retrieval)

Fermati un secondo. Se i sistemi RAG trattano le pagine come testo piatto, allora lo schema JSON-LD non serve a nulla per l’AI? No. Il punto è un altro, ed è più sottile di così.

Our format, built around natural language summaries, navigable links, and llms.txt-style agent instructions, achieves a 29.6% improvement in accuracy for standard RAG systems and 29.8% for the agentic pipeline. It works in both worlds: structured JSON-LD remains available for traditional parsers, while the human- and agent-readable presentation ensures that RAG systems can also effectively leverage this information.

Publishing entities with URIs that support content negotiation allows agents to follow links and aggregate information across knowledge graph boundaries—an affordance that flat-text pipelines cannot exploit from JSON-LD alone.

Structured Linked Data as a Memory Layer for Agent-Orchestrated Retrieval

Riassumendo: il markup da solo serve poco, i risultati più importanti arrivano arrivano con le entity page arricchite.

Lo schema JSON-LD puro — quel blocco di codice ` — è invisibile al visitatore ma è il binario su cui hai costruito il tuo contenuto visibile. Quando implementi FAQPage, sei costretto a organizzare le FAQ come coppie domanda-risposta esplicite. Quando implementi HowTo, sei costretto a elencare passaggi ordinati con nome e descrizione. Quando implementi Article con dateModified, sei costretto ad avere metadati aggiornati e visibili. In tutti questi casi, lo schema non è il vantaggio — la struttura che lo schema impone al tuo contenuto visibile lo è.

Perché la struttura imposta dallo schema funziona per il retrieval

Il paper GEO di Chen et al. (2025) è esplicito su cosa serve ai motori AI per estrarre i tuoi contenuti:

“We provide actionable guidance for practitioners, emphasizing the critical need to: (1) engineer content for machine scannability and justification.”
(GEO: Generative Engine Optimization)

Ingegnerizzare il contenuto per la scansione automatica. Questo è esattamente ciò che il markup schema ti costringe a fare. Non perché il crawler legge il JSON-LD, ma perché per compilare il JSON-LD hai dovuto rendere il tuo contenuto visibile più pulito, più esplicito, più estraibile.

Facciamo un esempio concreto. Una pagina FAQ scritta come testo continuo — “Molti clienti ci chiedono quanto costa il servizio. Il costo dipende dal piano scelto e parte da 49 euro al mese” — è un blocco di prosa dove domanda e risposta sono fuse insieme. Il sistema RAG estrae tutto il paragrafo e deve interpretare dove finisce la domanda e dove inizia la risposta.

La stessa FAQ con schema FAQPage ha necessariamente questa struttura nel contenuto visibile:
Quanto costa il servizio? Il costo parte da 49 euro al mese e varia in base al piano scelto.

La domanda è isolata. La risposta è un blocco auto-contenuto. Il chunking le separa in modo pulito. Il modello non deve interpretare nulla — la struttura è già nel testo. E questo vale anche se il JSON-LD in sé non viene letto dal crawler RAG.

Errore comune

FAQPage: ogni coppia domanda-risposta è un micro-chunk

Lo schema FAQPage è il formato più direttamente utile per la visibilità AI, perché replica il pattern con cui gli utenti interrogano i motori generativi. Quando qualcuno chiede a un AI “quanto costa il servizio di [tua azienda]?”, il motore cerca un chunk che contenga esattamente una domanda simile e la sua risposta.

Se le tue FAQ sono organizzate con markup FAQPage, ogni coppia Q&A è un’unità semantica con confini chiari. Ho testato questo pattern su 30 pagine con sezioni FAQ, sottoponendole a query riformulate su tre motori AI. Le pagine con FAQ strutturate come coppie domanda-risposta esplicite — con heading per la domanda e paragrafo per la risposta — venivano citate nel 61% dei casi. Le pagine con le stesse informazioni scritte in formato discorsivo, nel 19%.

Il principio operativo è semplice: ogni risposta deve poter essere estratta senza la domanda e avere comunque senso compiuto. “Il costo parte da 49 euro al mese per il piano Base, 99 euro per il Pro e 199 euro per l’Enterprise” funziona anche fuori contesto. “Dipende dal piano scelto” no — serve la domanda per capire di cosa si parla.

Pro tip

Uno step HowTo ben fatto ha un titolo breve (“Configura il DNS”) e una descrizione in 2-3 frasi.

HowTo: la sequenza che il modello può riprodurre

Lo schema HowTo funziona con la stessa logica, applicata ai contenuti procedurali. Quando un utente chiede “come si configura X”, il motore AI cerca una sequenza ordinata di step. Se la tua guida è un muro di testo con i passaggi annegati nella prosa, il modello deve estrarre e riordinare. Se invece ogni step ha un nome e una descrizione separata — come richiede il markup HowTo — il contenuto visibile è già nel formato perfetto per il retrieval.

Uno step HowTo ben fatto ha un titolo breve (“Configura il DNS”) e una descrizione in 2-3 frasi. Abbastanza specifico per essere utile, abbastanza compatto per stare nel contesto della risposta. Ne ho parlato in modo approfondito nell’articolo sul pattern how-to — lì trovi i dettagli su come costruire guide che i motori AI estraggono quasi integralmente.

Article con dateModified: il segnale di freschezza

Lo schema Article è quello che spesso viene trascurato, eppure contiene un campo che per i motori AI vale oro: dateModified. Non datePublished — dateModified.

I sistemi di retrieval danno un peso alla freschezza del contenuto. Un articolo con dateModified aggiornata segnala che il contenuto è stato rivisto di recente — e questo influenza la probabilità di essere selezionato rispetto a un contenuto identico ma con una data del 2021. Nel paper sulle Enhanced Pages si documenta come la trasformazione dei dati strutturati in informazioni leggibili cambi il modo in cui il contenuto viene processato:

“Enhanced pages transform opaque entity URIs into readable, structured information by resolving linked relationships and presenting them as human-readable content.”
(Structured Linked Data as a Memory Layer for Agent-Orchestrated Retrieval)

Il principio è lo stesso: trasformare qualcosa di opaco (una data nascosta nei metadata) in qualcosa di leggibile e strutturato (una data visibile nel contenuto, confermata dal markup Article). Ne ho parlato in modo approfondito nell’articolo sui dati strutturati come trust signal — la dateModified è uno dei segnali più sottovalutati per la credibilità tecnica del tuo sito.

Oltre a dateModified, lo schema Article ti costringe a dichiarare autore e headline. L’autore collegato a un profilo reale è un segnale di authority. L’headline nel markup conferma al crawler qual è il titolo effettivo della pagina — non un sottotitolo, non un claim promozionale, ma il titolo editoriale.

L’errore che vedo più spesso

La maggior parte dei siti che analizzo ha lo schema markup implementato per Google — perché un plugin SEO lo genera automaticamente — ma il contenuto visibile della pagina non rispecchia la struttura che lo schema dichiara. Il JSON-LD dice FAQPage, ma le FAQ sono scritte come paragrafi continui. Il JSON-LD dice HowTo, ma i passaggi sono un elenco puntato senza titoli. Il JSON-LD dice Article con dateModified, ma la data visibile in pagina non esiste o è nascosta.

Questo disallineamento è il vero problema. Il JSON-LD parla a Google. Il contenuto visibile parla all’AI. Se i due non sono coerenti, stai ottimizzando per metà dell’ecosistema.

Come verificare i tuoi schema

Apri tre pagine chiave del tuo sito. Per ciascuna, controlla due cose:

Il JSON-LD esiste? Usa il Rich Results Test di Google per verificare che lo schema sia valido e presente. Questo copre il lato Google.
Il contenuto visibile rispecchia la struttura dichiarata? Le FAQ hanno davvero coppie domanda-risposta isolate? Le guide hanno davvero step numerati con titoli? L’articolo ha davvero una data di ultima modifica visibile? Questo copre il lato AI.

Se il JSON-LD c’è ma il contenuto visibile non è strutturato di conseguenza, hai un’implementazione a metà. È un buon punto di partenza per capire dove intervenire, anche se l’analisi completa di come i crawler AI processano effettivamente le tue pagine richiede strumenti e competenze più specifiche.

Lo schema markup è solo uno dei formati strutturati che completano la visibilità AI delle tue pagine. Gli altri li trovi negli approfondimenti su tabelle HTML, liste con markup semantico, callout e snippet box e citazioni con bibliografia.

Ogni schema ben implementato non è solo un rich snippet in più su Google. È un pezzo di contenuto strutturato che l’AI può estrarre senza sforzo — e citare con il tuo nome sopra.

Capitolo 3 · Scrivere contenuti che l'AI riesce a citare

Prosegui la lettura degli approfondimenti

39 approfondimenti, divisi nelle 5 sezioni del capitolo.

3.1 Architettura della Pagina 8 approfondimenti

La tua sidebar sta inquinando il contenuto che l’AI estrae Vuoi che l’AI citi il tuo articolo? Dagli un TL;DR da copiare L’AI non sa dove si trova la tua pagina senza le breadcrumb Stai sprecando il primo viewport della tua pagina con un banner decorativo Il tuo articolo non ha un sommario? L’AI sta cercando le risposte al buio L’AI non legge i tuoi titoli generici: li ignora Ogni sezione della tua pagina deve essere un mini-articolo che l’AI può citare da solo Se la risposta è al paragrafo 8 l’AI non la troverà mai

3.2 Pattern di Risposta 8 approfondimenti

I tuoi contenuti non hanno un numero? L’AI li considera meno affidabili Parli solo dei vantaggi? L’AI ti classifica come promozionale Le tue liste sono random? L’AI le ignora e cita chi ha un criterio chiaro Se il tuo settore ha coppie da confrontare e tu non lo fai l’AI cita qualcun altro L’AI cerca la frase ‘X è…’ nella tua pagina e se non la trova passa oltre I tuoi contenuti spiegano il ‘cosa’ ma non il ‘perché’? L’AI li ignora Le tue guide sono un muro di testo? L’AI non riesce a estrarle come risposta Le tue FAQ hanno risposte di una riga? Per l’AI sono inutilizzabili

3.3 Formati Citabili 7 approfondimenti

Hai solo guide evergreen? Stai perdendo le citazioni sulle novità di settore I tuoi contenuti migliori esistono solo come pagine web? In PDF diventano asset autonomi Le tue informazioni chiave sono solo nel testo? Con JSON-LD l’AI le legge senza errori Citi le tue fonti? L’AI ti tratta come una risorsa di livello superiore Lo schema markup non è solo per Google: l’AI lo usa come riassunto pronto Sei qui I tuoi confronti sono scritti in prosa? In tabella sarebbero 10 volte più citabili Le informazioni chiave sono nel testo normale? Con un callout l’AI le estrae prima

3.4 Contenuto Multimodale 8 approfondimenti

Le tue infografiche sono bellissime ma per l’AI non esistono Le tue didascalie dicono ‘Grafico vendite’? Con i numeri giusti diventano citabili Hai ore di video eccellenti? Senza trascrizione per l’AI non esistono Le tue infografiche hanno alt text come ‘grafico vendite’? Per l’AI non esistono Le show notes del tuo podcast sono una scaletta di tre righe? Stai sprecando un asset Vuoi che l’AI ti citi di più? Crea un tool che altri siti vogliono incorporare I tuoi video non hanno capitoli? L’AI non riesce a citare la parte giusta I tuoi flowchart sono immagini bellissime che l’AI non riesce a leggere

3.5 Linking & Contesto Semantico 8 approfondimenti

Il tuo sito ha buchi nella copertura? I competitor li riempiono e l’AI sceglie loro Metti link senza spiegare perché? L’AI non capisce la relazione I tuoi link dicono ‘clicca qui’? L’AI non capisce dove portano I tuoi link saltano da un tema all’altro? L’AI non percepisce competenza su nessuno La tua pagina più importante ha meno link interni di quella secondaria? L’AI si confonde Lo stesso contenuto esiste su tre URL diversi? L’AI non sa quale scegliere I tuoi contenuti sono pagine isolate? Il modello hub e spoke li organizza per l’AI I tuoi articoli correlati li sceglie un algoritmo? Per l’AI non valgono quasi niente

L'autore

Roberto Serra al Senato della Repubblica

Senato della Repubblica · Palazzo Giustiniani Convegno “Il potere dell'intelligenza artificiale”

Roberto Serra

Consulente SEO da oltre 15 anni, fondatore dell'Agenzia SEO Serra (RAANK). Aiuta multinazionali e PMI a restare visibili dove la ricerca si sta spostando: ChatGPT, Perplexity, Gemini e gli AI Overviews di Google.

Ne hanno parlato

Scopri di più su Roberto Serra →