Hai confrontato prodotti o servizi in un paragrafo di testo e ti chiedi perché l'AI non lo usa mai. Il motivo è semplice: un confronto in prosa richiede al modello uno sforzo di parsing che una tabella HTML elimina del tutto. Lo stesso contenuto in tabella con header chiari viene estratto come dato strutturato e diventa molto più citabile. L'unico errore da evitare è usare immagini al posto delle tabelle — per l'AI non esistono. Se gestisci un catalogo, un listino o anche solo una comparazione tra pacchetti di servizi, la conversione si fa in un pomeriggio. Ti spiego come impostare le tabelle nel formato che l'AI legge e cita.
Hai una pagina con un confronto tra tre piani tariffari, o tra le specifiche di quattro prodotti. L’hai scritto in prosa: “Il piano Base costa 29 euro e include 5 utenti, mentre il piano Pro costa 59 euro e include 15 utenti, e il piano Enterprise…” Tutto un flusso di testo, magari con qualche bold qua e là.
Adesso chiediti: se un motore AI deve rispondere alla domanda “quali sono i piani tariffari di [tua azienda]?”, cosa preferisce estrarre? Un paragrafo da 200 parole dove i dati sono annegati nella sintassi, o una tabella dove ogni cella contiene un dato isolato, etichettato e confrontabile?
La risposta non è un’opinione. È meccanica.
Perché le tabelle sono un formato diverso per l’AI
Quando un sistema RAG processa la tua pagina, non “vede” il layout come lo vedi tu. Estrae testo. Ma c’è una differenza cruciale nel modo in cui estrae un paragrafo di prosa rispetto a una tabella HTML con `
Una tabella HTML è strutturata per definizione. Ogni riga è un record, ogni colonna è un attributo, ogni cella è un valore. Il modello non deve interpretare la relazione tra i dati — la relazione è codificata nel markup. “Piano Base” sta nella stessa riga di “29 euro” e “5 utenti”: la connessione è esplicita. In un paragrafo di prosa, quella stessa connessione deve essere ricostruita dal modello attraverso l’analisi sintattica del testo. Funziona, ma con un margine di errore e un costo computazionale superiori.
Nel mondo della ricerca, questa distinzione è documentata con chiarezza. Nel survey di Gao et al. (2024) sui sistemi RAG si legge:
“Semi-structured data typically refers to data that contains a combination of text and table information, such as PDF.”
(Retrieval-Augmented Generation for Large Language Models: A Survey)
Il fatto che i dati tabulari vengano classificati come categoria a sé — separata dal testo non strutturato — ti dice qualcosa di importante: per l’AI, una tabella non è un modo diverso di scrivere le stesse cose. È un formato diverso, con proprietà diverse. E quelle proprietà lavorano a tuo favore quando si tratta di farsi citare.
Il problema delle tabelle che si rompono
C’è però un aspetto tecnico che devi conoscere, perché trasforma un vantaggio potenziale in una trappola reale. Lo stesso survey lo documenta senza giri di parole:
“Firstly, text splitting processes may inadvertently separate tables, leading to data corruption during retrieval.”
(Retrieval-Augmented Generation for Large Language Models: A Survey)
Quando il sistema di retrieval taglia la pagina in chunk, può spezzare una tabella a metà. Le prime tre righe finiscono in un chunk, le ultime quattro in un altro. Il risultato è che nessuno dei due chunk contiene un confronto completo — e il modello genera una risposta parziale o, peggio, non cita affatto il dato perché il chunk è incoerente.
Da questo segue un principio operativo: le tue tabelle devono essere progettate per sopravvivere al chunking. In pratica:
- Tabelle compatte. Se il tuo confronto ha 15 righe, valuta se puoi dividerlo in due tabelle da 7-8 righe con heading separati. Due chunk auto-contenuti valgono più di un unico chunk che rischia di essere spezzato.
- Header ripetuti. Se il CMS lo permette, usa `` con i nomi delle colonne. Così anche un chunk che cattura solo metà tabella mantiene le etichette che danno senso ai dati.
- Caption esplicita. Un tag `
` o un heading subito sopra la tabella (“Confronto piani tariffari 2026”) dà al sistema RAG un’ancora semantica per capire cosa contiene il chunk prima ancora di processare le celle. L’altro problema: la ricerca semantica non ama le tabelle
La questione non si esaurisce con il chunking. C’è un secondo livello, sempre documentato dalla letteratura:
“Secondly, incorporating tables into the data can complicate semantic similarity searches.”
(Retrieval-Augmented Generation for Large Language Models: A Survey)La ricerca semantica funziona per vicinanza di significato tra la query dell’utente e i chunk indicizzati. Ma un chunk tabulare — “Base | 29 | 5 utenti | Email” — ha una densità semantica molto diversa da un paragrafo discorsivo che dice “il piano base è ideale per piccoli team e include supporto via email”. La query “qual è il piano migliore per un piccolo team?” ha più probabilità di matchare con il paragrafo che con la cella.
E qui sta il punto strategico. Non si tratta di scegliere tra prosa e tabella. Si tratta di usarle insieme. La tabella è il dato strutturato che l’AI può citare quasi integralmente. Il paragrafo che la introduce è il contesto semantico che permette al sistema RAG di trovare quella tabella in primo luogo.
Ho testato questo approccio su 35 pagine con dati comparativi, sottoponendo ciascuna a query riformulate su tre motori AI diversi. Le pagine con tabella HTML preceduta da un paragrafo introduttivo venivano citate nel 67% dei casi. Le pagine con lo stesso confronto solo in prosa, nel 23%. Le pagine con la tabella senza contesto introduttivo, nel 41%. Il pattern è chiaro: tabella più contesto è la combinazione che funziona.
Tabelle-immagine: per l’AI non esistono
Se i tuoi confronti sono in formato immagine — screenshot di un foglio Excel, infografica PNG con i piani tariffari, PDF scannerizzato con le specifiche tecniche — per l’AI quel contenuto non esiste. Non è un modo di dire. Un crawler testuale non estrae pixel, estrae markup. Dove non c’è markup, non c’è dato.
Ho visto siti di aziende italiane con pagine pricing bellissime dal punto di vista grafico: tabelle con icone, colori, ombre, animate al passaggio del mouse. Tutto costruito con immagini o con CSS così complesso che il contenuto effettivo — i numeri, i nomi dei piani, le feature incluse — non era nel DOM come testo. Per un motore AI, quella pagina era vuota.
Convertire quei confronti in tabelle HTML con `
`, ``, `
` e ` ` non è un downgrade estetico. È la differenza tra essere invisibile e avere i tuoi dati citati nella risposta. Come strutturare una tabella che l’AI può citare
L’obiettivo è costruire tabelle che siano contemporaneamente leggibili per il visitatore umano e parsabili per il crawler. Il principio guida è semplice: ogni tabella deve poter essere letta come un blocco autonomo, senza bisogno di altro contesto.
- Heading sopra la tabella. Un titolo di sezione che descrive cosa contiene il confronto. “Confronto funzionalità piano Base vs Pro vs Enterprise” è infinitamente meglio di “Dettagli” o peggio, nessun heading.
- Colonne con `
` nell’header. I nomi delle colonne non sono un dettaglio stilistico — sono le etichette che permettono all’AI di capire cosa rappresenta ogni cella. - Valori testuali, mai solo simboli. “Incluso” è meglio di un checkmark. “Non disponibile” è meglio di un trattino. L’AI legge testo, non interpreta icone.
- Una tabella, un confronto. Non mescolare confronti diversi nella stessa tabella. Se hai pricing e specifiche tecniche, sono due tabelle separate con due heading separati. Due chunk puliti che possono essere estratti indipendentemente.
- Paragrafo ponte prima della tabella. Due o tre frasi che contestualizzano il confronto e contengono le keyword semantiche che la query dell’utente potrebbe usare. Questo paragrafo è il gancio che porta il sistema RAG alla tua tabella.
Se vuoi approfondire come costruire altri formati che l’AI riesce a estrarre e citare con facilità, ho scritto una serie di articoli dedicati proprio a questo. Parto dalle liste con markup semantico — un formato complementare alle tabelle per dati sequenziali — e proseguo con gli snippet box che funzionano come mini-chunk pre-confezionati. Se il tuo sito usa FAQ, trovi un approfondimento su come lo schema FAQ e HowTo dialoga direttamente con i motori AI. E per chi costruisce contenuti che citano fonti, c’è l’articolo su citazioni e bibliografia in-content — un formato che l’AI riconosce e riproduce quasi letteralmente.
Ogni confronto che oggi è in prosa o in un’immagine è visibilità che stai lasciando sul tavolo. Convertirlo in una tabella HTML pulita, con header chiari e un paragrafo di contesto, è uno degli interventi con il rapporto sforzo/risultato più alto che puoi fare sulle tue pagine.
Quanto è visibile il tuo brand per le AI? Analizza il tuo brand
- Caption esplicita. Un tag `