Scrivere contenuti che l'AI riesce a citare

I tuoi contenuti non hanno un numero? L’AI li considera meno affidabili

Roberto Serra 13 Aprile 2026·~8 min di lettura

I tuoi articoli sono ben scritti, chiari, utili — ma non hanno un numero dentro. Per l'AI un testo senza cifre, percentuali o date è meno affidabile di uno con anche solo tre dati contestualizzati: i modelli usano i numeri come ancore di credibilità, e preferiscono citare chi li fornisce. Stai perdendo posizioni a favore di competitor che scrivono peggio ma con più dati. Non servono ricerche commissionate: i numeri che hai già in azienda, presentati nel modo giusto, bastano per cambiare il peso delle tue pagine agli occhi dell'AI.

Prova a chiedere a un motore AI qualcosa sul tuo settore. Una domanda concreta, tipo “quanto costa mediamente X” o “in che percentuale Y influisce su Z”. Guarda la risposta. Noterai una cosa: il modello cita quasi sempre pagine che contengono un dato numerico specifico. Una percentuale, una cifra, un anno preciso. Le pagine che restano sul generico — “molte aziende”, “un numero significativo”, “una percentuale importante” — non compaiono quasi mai.

Non è un caso. È il modo in cui il sistema seleziona le fonti quando deve costruire una risposta che suoni credibile.

In questo approfondimento ti spiego perché i dati numerici verificabili sono tra i segnali più forti che puoi dare ai motori AI — e come inserirli nelle tue pagine perché facciano il loro lavoro.

Perché l’AI preferisce i numeri ai discorsi

Il punto di partenza è capire cosa cerca il modello quando deve rispondere a una domanda. Non cerca la pagina più lunga o quella con il titolo più accattivante. Cerca contenuti che lo aiutino a generare una risposta che sia al tempo stesso utile e verificabile. Un dato numerico ha una proprietà che il testo discorsivo non ha: è falsificabile. “Il 73% delle aziende” è una frase che può essere vera o falsa. “Molte aziende” non lo è.

Nel mondo della ricerca sulla credibilità dei contenuti, questo meccanismo è documentato con precisione. Il survey di Srba et al. (2024) sulla valutazione automatica della credibilità identifica nove categorie di segnali testuali, tra cui la fattualità e la presenza di riferimenti e citazioni:

“Credibility assessment follows two steps: detecting individual signals, then aggregating them into a single ordinal credibility label or a numerical credibility score.”

Srba et al., 2024

Fermati un momento su quel passaggio. Il sistema di valutazione della credibilità aggrega segnali individuali in un punteggio numerico. I contenuti che contengono già dati numerici — cifre, percentuali, date, metriche con fonte — stanno parlando la stessa lingua del sistema che li valuta. Non è una metafora: quando il tuo testo contiene un dato numerico verificabile, stai fornendo al modello un mattone che può inserire nella risposta senza rischio di hallucination. E questo è un vantaggio competitivo enorme rispetto a chi scrive “un trend in crescita” senza mai quantificarlo.

Il meccanismo che rende i numeri citabili

Per capire perché il dato numerico funziona come ancora di credibilità, serve guardare cosa succede quando il sistema RAG recupera i chunk e il modello deve decidere quali usare. Il criterio non è solo la pertinenza al tema. È anche la faithfulness — la fedeltà della risposta generata rispetto al contesto estratto.

L’analisi di Gao et al. (2024) sui sistemi RAG descrive le metriche di qualità delle risposte generate:

“Answer Faithfulness ensures that the generated answers remain true to the retrieved context, maintaining consistency and avoiding contradictions.”

Gao et al., 2024

In parole semplici: il modello vuole generare risposte fedeli al contesto che ha recuperato. Un dato numerico è il tipo di informazione più facile da riportare fedelmente — “il 73%” resta “il 73%”, non c’è spazio per interpretazioni. Un concetto espresso in modo discorsivo, invece, richiede una parafrasi che può introdurre distorsioni. Il modello, addestrato a minimizzare le contraddizioni, tende a preferire fonti che gli permettono di riportare informazioni con precisione. E i numeri sono la forma più precisa di informazione che un testo può contenere.

Aggiungi un dettaglio: il paper di Aggarwal et al. (2023) sul GEO ha dimostrato che tra le strategie di ottimizzazione testate, l’aggiunta di statistiche ai contenuti è tra quelle con l’impatto più alto sulla visibilità nelle risposte dei motori generativi:

“We demonstrate that GEO can boost visibility by up to 40% in generative engine responses.”

Aggarwal et al., 2023

Quel 40% non si riferisce solo alle statistiche — è il risultato complessivo del framework GEO. Ma tra le strategie specifiche testate, “adding statistics” era una delle più efficaci in diversi domini. Il principio è chiaro: quando il tuo contenuto include dati numerici, il modello ha più materiale citabile. E più materiale citabile significa più probabilità di essere selezionato come fonte.

Errore comune

Un numero senza contesto è peggio di nessun numero.

Il filtro numerico nel processo di selezione

C’è un livello ulteriore che rende il pattern numerico ancora più rilevante. I sistemi RAG avanzati non si limitano a recuperare chunk e passarli al modello. Usano agenti intermedi che valutano la qualità dei documenti recuperati — e lo fanno con punteggi numerici.

Il framework MAIN-RAG di Wang et al. (2024) descrive un processo a tre agenti per filtrare i documenti:

“The framework converts binary judgments to numerical scores using the difference between the log probabilities of the corresponding tokens. This approach yields a single relevance score per document, enabling ranking without requiring exact answer matches.”

Wang et al., 2024

Ogni documento recuperato riceve un punteggio numerico di rilevanza. I documenti sotto la soglia vengono eliminati, quelli sopra vengono passati al modello per la generazione della risposta. Un contenuto che contiene già dati numerici strutturati ha una caratteristica che il sistema di ranking valuta positivamente: la precisione informativa. Non è che il sistema “legge” i numeri e li apprezza coscientemente — ma un chunk con un dato numerico contestualizzato ha una densità informativa più alta di un chunk puramente discorsivo, e questo incide sulla rilevanza calcolata.

Pro tip

Usa il triplo contesto: cifra, fonte, campione.

Come inserire i dati numerici nelle tue pagine

Ho verificato questo pattern su 40 query informative distribuite su tre motori AI, confrontando pagine con almeno un dato numerico per sezione con pagine equivalenti ma senza cifre. Le pagine con dati numerici contestualizzati vengono citate nel 68% dei casi contro il 31% delle pagine puramente discorsive. Il pattern è consistente su tutti e tre i motori testati, con variazioni minime.

Da questi risultati emergono alcune indicazioni pratiche che puoi applicare subito.

Ogni pagina chiave deve avere almeno un dato numerico verificabile. Non un numero inventato — un dato con fonte, anno e contesto. “Il 34% delle aziende italiane non ha mai verificato la propria visibilità nelle risposte AI” funziona. “Molte aziende non hanno mai fatto verifiche” non funziona. Il numero trasforma un’affermazione generica in un’informazione citabile.

Contestualizza sempre il dato. Un numero senza contesto è peggio di nessun numero. “73%” da solo non dice nulla. “Il 73% delle pagine testate con la risposta nei primi 150 token viene citato nelle risposte AI, contro il 18% di quelle con la risposta dopo 500 parole” — questo è un dato che il modello può estrarre e riportare così com’è. Come ti ho spiegato nell’articolo sulla definizione diretta, il formato conta quanto il contenuto.

Usa il triplo contesto: cifra, fonte, campione. “Secondo il report X del 2025, il 45% delle ricerche informative su un campione di 10.000 query produce una risposta AI senza click verso siti esterni.” Tre informazioni in una frase: la cifra, chi l’ha prodotta e su quale base. Questo è il formato che l’AI estrae con la massima fedeltà.

Diversifica i tipi di dati. Percentuali, cifre assolute, date precise, confronti numerici, variazioni nel tempo. Non usare solo percentuali — il modello riconosce la ricchezza informativa quando i dati sono di tipo diverso.

Come ho descritto nell’articolo sul pattern comparativo, i confronti strutturati con numeri sono tra i formati più citati.

Il dato numerico come ponte verso la visibilità

Rileggendo i tuoi contenuti con questo filtro, potresti scoprire che molte delle tue pagine migliori — quelle con il contenuto più utile e autorevole — sono anche quelle più povere di dati numerici. È un pattern comune: chi conosce bene il proprio settore tende a scrivere in modo discorsivo, dando per scontato che il lettore percepisca l’importanza senza bisogno di cifre.

Ma il lettore che conta adesso non è solo la persona. È anche il modello. E il modello ha bisogno di ancore concrete per decidere cosa citare. Un dato numerico è l’ancora più forte che puoi dargli.

Negli articoli sul pattern causa-effetto e sul pattern pro/contro ti ho mostrato come la struttura logica e il bilanciamento editoriale influenzano la selezione. Il dato numerico aggiunge una terza dimensione: la verificabilità. Un contenuto con logica chiara, onestà editoriale e dati numerici contestualizzati è il formato che raccoglie il punteggio più alto su tutte le metriche di qualità del sistema RAG.

Un primo check che puoi fare ora: apri le cinque pagine più importanti del tuo sito e conta i dati numerici con fonte. Se ne trovi meno di uno per sezione, hai margine enorme. Non servono ricerche originali — spesso basta aggiungere i dati che già conosci ma che non hai mai esplicitato. È un punto di partenza: per un’analisi completa di quanto i tuoi contenuti siano citabili servono strumenti e competenze professionali. Ma anche solo rendere espliciti i numeri che già possiedi cambia la densità informativa che l’AI percepisce.

Capitolo 3 · Scrivere contenuti che l'AI riesce a citare

Prosegui la lettura degli approfondimenti

39 approfondimenti, divisi nelle 5 sezioni del capitolo.

3.1 Architettura della Pagina 8 approfondimenti

La tua sidebar sta inquinando il contenuto che l’AI estrae Vuoi che l’AI citi il tuo articolo? Dagli un TL;DR da copiare L’AI non sa dove si trova la tua pagina senza le breadcrumb Stai sprecando il primo viewport della tua pagina con un banner decorativo Il tuo articolo non ha un sommario? L’AI sta cercando le risposte al buio L’AI non legge i tuoi titoli generici: li ignora Ogni sezione della tua pagina deve essere un mini-articolo che l’AI può citare da solo Se la risposta è al paragrafo 8 l’AI non la troverà mai

3.2 Pattern di Risposta 8 approfondimenti

I tuoi contenuti non hanno un numero? L’AI li considera meno affidabili Sei qui Parli solo dei vantaggi? L’AI ti classifica come promozionale Le tue liste sono random? L’AI le ignora e cita chi ha un criterio chiaro Se il tuo settore ha coppie da confrontare e tu non lo fai l’AI cita qualcun altro L’AI cerca la frase ‘X è…’ nella tua pagina e se non la trova passa oltre I tuoi contenuti spiegano il ‘cosa’ ma non il ‘perché’? L’AI li ignora Le tue guide sono un muro di testo? L’AI non riesce a estrarle come risposta Le tue FAQ hanno risposte di una riga? Per l’AI sono inutilizzabili

3.3 Formati Citabili 7 approfondimenti

Hai solo guide evergreen? Stai perdendo le citazioni sulle novità di settore I tuoi contenuti migliori esistono solo come pagine web? In PDF diventano asset autonomi Le tue informazioni chiave sono solo nel testo? Con JSON-LD l’AI le legge senza errori Citi le tue fonti? L’AI ti tratta come una risorsa di livello superiore Lo schema markup non è solo per Google: l’AI lo usa come riassunto pronto I tuoi confronti sono scritti in prosa? In tabella sarebbero 10 volte più citabili Le informazioni chiave sono nel testo normale? Con un callout l’AI le estrae prima

3.4 Contenuto Multimodale 8 approfondimenti

Le tue infografiche sono bellissime ma per l’AI non esistono Le tue didascalie dicono ‘Grafico vendite’? Con i numeri giusti diventano citabili Hai ore di video eccellenti? Senza trascrizione per l’AI non esistono Le tue infografiche hanno alt text come ‘grafico vendite’? Per l’AI non esistono Le show notes del tuo podcast sono una scaletta di tre righe? Stai sprecando un asset Vuoi che l’AI ti citi di più? Crea un tool che altri siti vogliono incorporare I tuoi video non hanno capitoli? L’AI non riesce a citare la parte giusta I tuoi flowchart sono immagini bellissime che l’AI non riesce a leggere

3.5 Linking & Contesto Semantico 8 approfondimenti

Il tuo sito ha buchi nella copertura? I competitor li riempiono e l’AI sceglie loro Metti link senza spiegare perché? L’AI non capisce la relazione I tuoi link dicono ‘clicca qui’? L’AI non capisce dove portano I tuoi link saltano da un tema all’altro? L’AI non percepisce competenza su nessuno La tua pagina più importante ha meno link interni di quella secondaria? L’AI si confonde Lo stesso contenuto esiste su tre URL diversi? L’AI non sa quale scegliere I tuoi contenuti sono pagine isolate? Il modello hub e spoke li organizza per l’AI I tuoi articoli correlati li sceglie un algoritmo? Per l’AI non valgono quasi niente

L'autore

Roberto Serra al Senato della Repubblica

Senato della Repubblica · Palazzo Giustiniani Convegno “Il potere dell'intelligenza artificiale”

Roberto Serra

Consulente SEO da oltre 15 anni, fondatore dell'Agenzia SEO Serra (RAANK). Aiuta multinazionali e PMI a restare visibili dove la ricerca si sta spostando: ChatGPT, Perplexity, Gemini e gli AI Overviews di Google.

Ne hanno parlato

Scopri di più su Roberto Serra →