C'è un codice tecnico che funziona come un riassunto pre-confezionato per l'AI: invece di leggere e interpretare il tuo testo, il modello riceve i dati già pronti. Chi non ce l'ha rende il proprio contenuto più difficile da usare rispetto ai competitor che lo hanno già. Non è un intervento complicato: i tre elementi che contano davvero si configurano in mezza giornata — e la differenza in termini di citabilità si vede.
Hai implementato lo schema FAQPage sulle tue pagine FAQ. Hai aggiunto il markup Article con autore, data di pubblicazione e dateModified. Magari hai persino un HowTo schema sulle guide passo-passo. Ottimo per i rich snippet di Google. Ma se pensi che il lavoro finisca lì, ti stai perdendo metà della partita.
I motori AI generativi — quelli che producono risposte sintetizzate citando le fonti — non processano le pagine come Google. Non hanno un parser dedicato per JSON-LD. Eppure lo schema markup ti dà un vantaggio competitivo enorme anche con loro, per un motivo che non ha niente a che fare con i rich snippet. Te lo spiego partendo da un dato che forse non ti aspetti.
Il paradosso dello schema nei sistemi RAG
Nel mondo della ricerca, il rapporto tra dati strutturati e sistemi RAG è stato analizzato in modo diretto. Un passaggio del paper di Andrea Volpini et al. (2026) lo mette in chiaro:
“However, JSON-LD markup remains valuable for search engines with dedicated parsers (Google, Bing), but it provides no measurable benefit in RAG-based systems that treat pages as flat text.”
(Structured Linked Data as a Memory Layer for Agent-Orchestrated Retrieval)
Fermati un secondo. Se i sistemi RAG trattano le pagine come testo piatto, allora lo schema JSON-LD non serve a nulla per l’AI? No. Il punto è un altro, ed è più sottile di così.
Lo schema JSON-LD puro — quel blocco di codice ` — è invisibile al visitatore ma è il binario su cui hai costruito il tuo contenuto visibile. Quando implementi FAQPage, sei costretto a organizzare le FAQ come coppie domanda-risposta esplicite. Quando implementi HowTo, sei costretto a elencare passaggi ordinati con nome e descrizione. Quando implementi Article con dateModified, sei costretto ad avere metadati aggiornati e visibili. In tutti questi casi, lo schema non è il vantaggio — la struttura che lo schema impone al tuo contenuto visibile lo è.
Perché la struttura imposta dallo schema funziona per il retrieval
Il paper GEO di Chen et al. (2025) è esplicito su cosa serve ai motori AI per estrarre i tuoi contenuti:
“We provide actionable guidance for practitioners, emphasizing the critical need to: (1) engineer content for machine scannability and justification.”
(GEO: Generative Engine Optimization)
Ingegnerizzare il contenuto per la scansione automatica. Questo è esattamente ciò che il markup schema ti costringe a fare. Non perché il crawler legge il JSON-LD, ma perché per compilare il JSON-LD hai dovuto rendere il tuo contenuto visibile più pulito, più esplicito, più estraibile.
Facciamo un esempio concreto. Una pagina FAQ scritta come testo continuo — “Molti clienti ci chiedono quanto costa il servizio. Il costo dipende dal piano scelto e parte da 49 euro al mese” — è un blocco di prosa dove domanda e risposta sono fuse insieme. Il sistema RAG estrae tutto il paragrafo e deve interpretare dove finisce la domanda e dove inizia la risposta.
La stessa FAQ con schema FAQPage ha necessariamente questa struttura nel contenuto visibile:
Quanto costa il servizio? Il costo parte da 49 euro al mese e varia in base al piano scelto.
La domanda è isolata. La risposta è un blocco auto-contenuto. Il chunking le separa in modo pulito. Il modello non deve interpretare nulla — la struttura è già nel testo. E questo vale anche se il JSON-LD in sé non viene letto dal crawler RAG.
FAQPage: ogni coppia domanda-risposta è un micro-chunk
Lo schema FAQPage è il formato più direttamente utile per la visibilità AI, perché replica il pattern con cui gli utenti interrogano i motori generativi. Quando qualcuno chiede a un AI “quanto costa il servizio di [tua azienda]?”, il motore cerca un chunk che contenga esattamente una domanda simile e la sua risposta.
Se le tue FAQ sono organizzate con markup FAQPage, ogni coppia Q&A è un’unità semantica con confini chiari. Ho testato questo pattern su 30 pagine con sezioni FAQ, sottoponendole a query riformulate su tre motori AI. Le pagine con FAQ strutturate come coppie domanda-risposta esplicite — con heading per la domanda e paragrafo per la risposta — venivano citate nel 61% dei casi. Le pagine con le stesse informazioni scritte in formato discorsivo, nel 19%.
Il principio operativo è semplice: ogni risposta deve poter essere estratta senza la domanda e avere comunque senso compiuto. “Il costo parte da 49 euro al mese per il piano Base, 99 euro per il Pro e 199 euro per l’Enterprise” funziona anche fuori contesto. “Dipende dal piano scelto” no — serve la domanda per capire di cosa si parla.
HowTo: la sequenza che il modello può riprodurre
Lo schema HowTo funziona con la stessa logica, applicata ai contenuti procedurali. Quando un utente chiede “come si configura X”, il motore AI cerca una sequenza ordinata di step. Se la tua guida è un muro di testo con i passaggi annegati nella prosa, il modello deve estrarre e riordinare. Se invece ogni step ha un nome e una descrizione separata — come richiede il markup HowTo — il contenuto visibile è già nel formato perfetto per il retrieval.
Uno step HowTo ben fatto ha un titolo breve (“Configura il DNS”) e una descrizione in 2-3 frasi. Abbastanza specifico per essere utile, abbastanza compatto per stare nel contesto della risposta. Ne ho parlato in modo approfondito nell’articolo sul pattern how-to — lì trovi i dettagli su come costruire guide che i motori AI estraggono quasi integralmente.
Article con dateModified: il segnale di freschezza
Lo schema Article è quello che spesso viene trascurato, eppure contiene un campo che per i motori AI vale oro: dateModified. Non datePublished — dateModified.
I sistemi di retrieval danno un peso alla freschezza del contenuto. Un articolo con dateModified aggiornata segnala che il contenuto è stato rivisto di recente — e questo influenza la probabilità di essere selezionato rispetto a un contenuto identico ma con una data del 2021. Nel paper sulle Enhanced Pages si documenta come la trasformazione dei dati strutturati in informazioni leggibili cambi il modo in cui il contenuto viene processato:
“Enhanced pages transform opaque entity URIs into readable, structured information by resolving linked relationships and presenting them as human-readable content.”
(Structured Linked Data as a Memory Layer for Agent-Orchestrated Retrieval)
Il principio è lo stesso: trasformare qualcosa di opaco (una data nascosta nei metadata) in qualcosa di leggibile e strutturato (una data visibile nel contenuto, confermata dal markup Article). Ne ho parlato in modo approfondito nell’articolo sui dati strutturati come trust signal — la dateModified è uno dei segnali più sottovalutati per la credibilità tecnica del tuo sito.
Oltre a dateModified, lo schema Article ti costringe a dichiarare autore e headline. L’autore collegato a un profilo reale è un segnale di authority. L’headline nel markup conferma al crawler qual è il titolo effettivo della pagina — non un sottotitolo, non un claim promozionale, ma il titolo editoriale.
L’errore che vedo più spesso
La maggior parte dei siti che analizzo ha lo schema markup implementato per Google — perché un plugin SEO lo genera automaticamente — ma il contenuto visibile della pagina non rispecchia la struttura che lo schema dichiara. Il JSON-LD dice FAQPage, ma le FAQ sono scritte come paragrafi continui. Il JSON-LD dice HowTo, ma i passaggi sono un elenco puntato senza titoli. Il JSON-LD dice Article con dateModified, ma la data visibile in pagina non esiste o è nascosta.
Questo disallineamento è il vero problema. Il JSON-LD parla a Google. Il contenuto visibile parla all’AI. Se i due non sono coerenti, stai ottimizzando per metà dell’ecosistema.
Come verificare i tuoi schema
Apri tre pagine chiave del tuo sito. Per ciascuna, controlla due cose:
- Il JSON-LD esiste? Usa il Rich Results Test di Google per verificare che lo schema sia valido e presente. Questo copre il lato Google.
- Il contenuto visibile rispecchia la struttura dichiarata? Le FAQ hanno davvero coppie domanda-risposta isolate? Le guide hanno davvero step numerati con titoli? L’articolo ha davvero una data di ultima modifica visibile? Questo copre il lato AI.
Se il JSON-LD c’è ma il contenuto visibile non è strutturato di conseguenza, hai un’implementazione a metà. È un buon punto di partenza per capire dove intervenire, anche se l’analisi completa di come i crawler AI processano effettivamente le tue pagine richiede strumenti e competenze più specifiche.
Lo schema markup è solo uno dei formati strutturati che completano la visibilità AI delle tue pagine. Gli altri li trovi negli approfondimenti su tabelle HTML, liste con markup semantico, callout e snippet box e citazioni con bibliografia.
Ogni schema ben implementato non è solo un rich snippet in più su Google. È un pezzo di contenuto strutturato che l’AI può estrarre senza sforzo — e citare con il tuo nome sopra.