Quando un utente fa una domanda, l'AI la riscrive in 3-5 varianti prima di cercare la risposta. Se il tuo contenuto risponde solo alla formulazione letterale, stai intercettando una frazione delle possibilità. Ti spiego come coprire le riformulazioni più probabili e moltiplicare le query per cui il tuo contenuto viene trovato.
L’utente scrive: “come faccio a uscire su ChatGPT”. Il sistema AI non cerca esattamente quella frase. La riscrive in più varianti — “come comparire nelle risposte AI”, “ottimizzazione per ChatGPT”, “visibilità brand intelligenza artificiale” — e cerca tutte le varianti in parallelo.
Se il tuo contenuto risponde solo alla formulazione letterale della domanda, stai catturando una frazione delle possibilità. Tutte le riformulazioni ti sfuggono — e con loro, tutte le citazioni che avresti potuto ottenere.
Questo meccanismo si chiama Query Rewriting, ed è uno dei passaggi più sottovalutati della pipeline RAG. Non è una funzione accessoria: è la prima trasformazione che avviene sulla domanda dell’utente, prima ancora che il sistema vada a cercare qualcosa. Se non la capisci, stai ottimizzando per uno scenario che non esiste.
Perché la query originale non basta
Nel mondo della ricerca sul recupero aumentato, il problema della query originale è documentato con precisione. Come scrivono Ma et al. (2023) nel paper che introduce il framework Rewrite-Retrieve-Read:
“There is inevitably a gap between the input text and the needed knowledge in retrieval.”
Questo divario non è un difetto del sistema — è una caratteristica strutturale. L’utente formula la domanda nel suo linguaggio, con le sue ambiguità e il suo contesto implicito. Il sistema di recupero lavora su un corpus scritto con un linguaggio diverso, più tecnico o semplicemente organizzato intorno a concetti che l’utente non usa.
Ma et al. (2023) propongono di spostare l’attenzione dall’adattamento del retriever o del reader all’adattamento della query stessa. Il framework che descrivono, Rewrite-Retrieve-Read, inverte l’ordine tradizionale: prima si riscrive, poi si recupera, poi si legge. Non è un dettaglio implementativo — è un cambio di paradigma su dove si interviene.
La conseguenza pratica è diretta: non basta rispondere bene alla domanda come è formulata. Devi rispondere bene alla domanda come verrà cercata dopo la riformulazione.
Come funziona il Query Rewriting nella pipeline RAG
Il Query Rewriting è una fase della pipeline RAG in cui il sistema trasforma la domanda dell’utente prima di interrogare l’indice. Lo fa in tre modi principali.
Espansione semantica: la query originale viene arricchita con sinonimi, varianti terminologiche e formulazioni alternative. “Come uscire su ChatGPT” diventa anche “come comparire nelle risposte dei modelli linguistici” e “visibilità brand AI”. Il sistema genera versioni più ampie per aumentare la probabilità di trovare documenti rilevanti che usano terminologie diverse.
Disambiguazione: quando la query è ambigua, il sistema genera varianti che risolvono le ambiguità possibili. “Apple” viene trattata come azienda tecnologica e come frutto, a seconda del contesto. “Ottimizzazione” può riferirsi a SEO tradizionale o a machine learning. Il sistema non assume — esplora.
Decomposizione: una query complessa viene scomposta in sotto-query più semplici e recuperabili separatamente. “Qual è la differenza tra RAG e fine-tuning e quale conviene usare per la visibilità AI” diventa tre domande distinte, ciascuna con il proprio ciclo di recupero.
La letteratura lo documenta in modo netto. Nella survey di Gao et al. (2024):
“The original queries are not always optimal for LLM retrieval, especially in real-world scenarios. Therefore, we can prompt LLM to rewrite the queries. In addition to using LLM for query rewriting, specialized smaller language models, such as RRR (Rewrite-retrieve-read), can be adopted as a trainable rewriter.”
Il punto è rilevante: il rewriter non è necessariamente lo stesso modello che genera la risposta finale. Possono essere modelli più piccoli, addestrati specificamente per questo compito. Il che significa che la riformulazione è un passaggio sufficientemente critico da meritare un modello dedicato.
Sistemi come Perplexity e Google AI Overview generano tipicamente più riformulazioni per ogni query e cercano fonti per ciascuna. Il pool di risultati viene poi unificato e passato al reranker, che seleziona i documenti più rilevanti sull’insieme combinato. Il tuo contenuto non compete solo per la query originale — compete per tutte le riformulazioni che il sistema genera.
Il caso dei documenti ipotetici
C’è una variante del Query Rewriting che merita attenzione separata perché funziona in modo controintuitivo. Gao et al. (2024) la descrivono così:
“Another query transformation method is to use prompt engineering to let LLM generate a query based on the original query for subsequent retrieval. HyDE construct hypothetical documents. It focuses on embedding similarity from answer to answer rather than seeking embedding similarity for the problem or query.”
HyDE — Hypothetical Document Embeddings — è un approccio in cui il sistema non trasforma la query in un’altra query, ma genera un documento ipotetico che risponderebbe alla domanda. Poi usa l’embedding di quel documento immaginario per cercare documenti reali simili.
La conseguenza è tecnica ma importante: il confronto avviene tra due risposte, non tra una domanda e una risposta. Il sistema cerca documenti che somigliano a come dovrebbe essere la risposta, non documenti che contengono le parole della domanda.
Da questo segue che i tuoi contenuti devono essere strutturalmente simili a risposte complete — non a descrizioni di prodotti, non a pagine di categorie, non a testi promozionali. Un documento che risponde direttamente e con completezza a una domanda specifica ha più probabilità di essere recuperato da un sistema HyDE rispetto a un documento che descrive un servizio. La forma della risposta conta quanto il contenuto.
Lo scenario concreto: cosa succede alla tua pagina
Un marketing manager cerca su Perplexity: “perché il mio brand non esce su ChatGPT?”
Il sistema riscrive la query in quattro varianti:
- “brand non visibile ChatGPT motivi”
- “come aumentare visibilità brand nelle risposte AI”
- “ottimizzazione brand per modelli linguaggio”
- “perché ChatGPT non menziona il mio brand”
Per ciascuna, il sistema esegue un ciclo di recupero separato, basato su BM25 e ricerca ibrida. I chunk recuperati da ciascuna riformulazione vengono aggregati e passati al reranker.
Il tuo contenuto contiene “brand”, “ChatGPT” e “visibilità” ma non contiene “modelli di linguaggio” né “ottimizzazione”. Vieni trovato per due riformulazioni su quattro. Il tuo competitor ha una pagina che usa sia “ChatGPT” che “modelli di linguaggio”, sia “visibilità” che “ottimizzazione”, sia “brand” che “azienda”. Viene trovato per tutte e quattro le riformulazioni.
A parità di qualità, il competitor viene citato più spesso. Non perché il suo contenuto sia migliore — ma perché la sua copertura semantica è più ampia. Il vocabolario con cui scrivi determina quali riformulazioni intercetti.
Come adattare il tuo contenuto al Query Rewriting
Il punto di partenza è smettere di ottimizzare per una singola formulazione e iniziare a ottimizzare per un campo semantico.
- Mappa le riformulazioni per ogni pagina chiave: identifica la query principale e poi elenca 6-8 modi diversi in cui un utente potrebbe farla. Usa Google Suggest, People Also Ask, le ricerche correlate. Fai la stessa ricerca su Perplexity con formulazioni diverse: se le fonti cambiano, stai vedendo il Query Rewriting in azione.
- Verifica la copertura semantica: il testo della pagina contiene naturalmente le parole chiave delle principali riformulazioni? Se la tua pagina parla di “consulenza SEO” ma mai di “ottimizzazione per i motori di ricerca”, stai perdendo una riformulazione ovvia. Fai una ricerca nel testo (Ctrl+F) per ogni variante che hai mappato.
- Usa gli heading come riformulazioni sistematiche: ogni titolo di sezione può essere una variante della query principale. Il titolo della pagina risponde alla domanda come la formula l’utente, gli heading interni rispondono alle riformulazioni come le genera il sistema. In questo modo ogni chunk del documento è ottimizzato per una variante diversa — il che migliora anche il chunk retrieval a livello granulare.
- Integra le varianti nel corpo del testo in modo narrativo: non liste di sinonimi, non ripetizioni meccaniche — frasi discorsive che usano le varianti in contesto. “La consulenza SEO — o ottimizzazione per i motori di ricerca, come viene chiamata nei contesti tecnici — è il processo con cui…” copre due riformulazioni in una frase naturale.
- Struttura le FAQ come riformulazioni esplicite: una sezione FAQ è, tecnicamente, una lista di riformulazioni della stessa area tematica. “Come faccio a comparire su ChatGPT?”, “Perché il mio brand non esce nelle risposte AI?”, “Cosa serve per essere citati da Perplexity?” — tre domande distinte che coprono varianti terminologiche diverse e aumentano la superficie intercettabile.
- Forma delle risposte, non solo vocabolario: come suggerisce il meccanismo HyDE, i sistemi di recupero confrontano embedding di risposte con embedding di risposte. Un contenuto che risponde direttamente e con completezza a una domanda specifica — con struttura chiara, senza ambiguità, con il punto principale nei primi due paragrafi — è strutturalmente più simile al documento ipotetico che il sistema ha generato internamente.
Il test pratico da fare oggi
Per ogni pagina chiave del tuo sito:
- Scrivi la query principale a cui la pagina risponde
- Elenca 5 riformulazioni di quella query — almeno due con terminologia tecnica, almeno due con linguaggio comune
- Cerca ciascuna riformulazione nel testo della pagina
- Conta per quante riformulazioni la pagina contiene le parole chiave principali
Se la copertura è sotto il 60% — tre riformulazioni su cinque non trovate — stai perdendo visibilità non per mancanza di qualità, ma per mancanza di ampiezza semantica.
Il Query Rewriting non è qualcosa che puoi controllare — è il sistema che decide come riformulare. Ma puoi controllare la tua copertura semantica: quanto del tuo vocabolario si sovrappone con le riformulazioni più probabili. Più ampia è la sovrapposizione, più riformulazioni intercetti, più citazioni ottieni.