Anche se l’AI trova il tuo contenuto tra le fonti candidate, c’è un secondo passaggio di selezione che lo riordina per rilevanza alla domanda specifica — e i contenuti che parlano dell’argomento in modo generico vengono scartati a favore di chi risponde esattamente a quella domanda. Puoi passare il primo filtro e perdere al secondo, senza capire perché non vieni mai citato. Non è un problema di quantità di contenuto né di lunghezza: è un problema di precisione. Scrivere contenuti che superano entrambi i filtri richiede un approccio diverso da quello che probabilmente stai usando.

Il tuo contenuto ha superato il primo filtro. Il sistema RAG ha fatto il retrieval iniziale, ha recuperato 20-100 chunk candidati, e il tuo pezzo è tra quelli. Bene. Ma non è finita — il round decisivo deve ancora arrivare.

C’è un secondo modello che prende quei chunk e li riordina. Non per somiglianza vaga, ma per corrispondenza precisa con la domanda reale dell’utente. È qui che i contenuti generici vengono retrocessi, quelli specifici e autorevoli salgono, e il tuo brand o ottiene visibilità AI o sparisce definitivamente dal contesto che l’AI userà per rispondere.

Questa è meccanica, non opinione. E se non capisci come funziona, stai ottimizzando per il filtro sbagliato.

Perché il retrieval da solo non basta

Se hai letto quello che ti ho spiegato sul chunk retrieval, sai che il sistema recupera un pool iniziale di blocchi basandosi su embedding vettoriali e ricerca lessicale. Ti ho parlato di come ogni sezione debba funzionare come un’unità autonoma — ma superare il retrieval è solo il primo cancello.

Il retrieval è veloce e approssimativo per definizione: confronta la tua rappresentazione vettoriale con quella della query e decide se sei “abbastanza vicino”. Il problema è che “abbastanza vicino” include molta spazzatura. Una pagina “Servizi SEO” che menziona ecommerce è semanticamente vicina alla query “come scegliere un consulente SEO per un ecommerce” — ma non risponde alla domanda.

È qui che entra il reranking.

Come funziona il reranking — il secondo filtro

Dopo il retrieval hai ancora un pool ampio di candidati: 20, 50, a volte 100 chunk. Passarli tutti al modello generativo sarebbe impossibile — sia per i limiti della finestra di contesto, sia perché immetteresti troppo rumore. Il reranker risolve questo problema.

A differenza del retrieval, che usa rappresentazioni separate (embedding della query + embedding del documento), il reranker è tipicamente un cross-encoder: prende la query e il chunk insieme, li processa in un unico passaggio, e assegna un punteggio di rilevanza basato sull’interazione diretta tra i due testi. È computazionalmente costoso — ma preciso.

Nel mondo della ricerca, il tema è studiato in profondità. Un passaggio che trovo rilevante viene da MiaoMiao et al. (2025):

“In addition to serving as a decision assessor for evaluating or re-ranking candidate outputs to improve alignment without parameter updates, RMs can also function as a utility function to guide prompt construction.”

Tradotto: il modello di reranking non si limita a riordinare — valuta la qualità dell’output rispetto alla query originale e può guidare la costruzione stessa del contesto che il generatore riceverà. È un arbitro che decide quale contenuto merita di entrare nella risposta finale.

La conseguenza pratica è che il reranker penalizza il contenuto che “parla dell’argomento” ma non risponde alla domanda. E premia chi risponde in modo diretto, specifico e autorevole.

Le dimensioni che il reranker valuta

Non tutti i sistemi di reranking funzionano allo stesso modo.

Ci sono diversi tipi di reranker attivi nelle pipeline commerciali — alcuni modelli specializzati per la valutazione di rilevanza, altri LLM generali usati come giudici. Cambiano nel tempo e variano tra i motori AI: qualsiasi test è un campione, non una verità assoluta.

Quello che accomuna tutti questi approcci è che valutano tre dimensioni fondamentali:

Rilevanza topica — il chunk risponde alla domanda specifica o parla solo dell’argomento in senso lato? “Forniamo servizi SEO per ecommerce” non risponde a “come scegliere”. “Per valutare un consulente SEO per ecommerce, chiedi questi 5 dati” risponde.

Pertinenza contestuale — il chunk ha il contesto necessario per essere compreso da solo? Come ti ho spiegato nell’articolo sul chunk retrieval, ogni blocco deve funzionare come unità autonoma. Il reranker penalizza chi presuppone conoscenze esterne al testo.

Diversità — nei sistemi più sofisticati, il reranker bilancia anche la varietà delle fonti, evitando 5 chunk identici sullo stesso concetto. Se hai 3 pagine che dicono la stessa cosa, solo una passa.

Un esempio concreto: chi sopravvive al reranking

Query dell’utente: “come scegliere un consulente SEO per un ecommerce?”

Il retrieval recupera tre candidati: la tua pagina “Servizi SEO” (menziona SEO, consulenza, ecommerce tra i settori), il blog di un competitor (“7 criteri per scegliere il consulente SEO per il tuo ecommerce”) e una guida generica al digital marketing per ecommerce.

Il reranker confronta ciascun chunk con la query. La tua pagina parla di cosa fai, non risponde a “come scegliere”. Il competitor risponde con criteri specifici. La guida è ampia ma non focalizzata sulla decisione.

Risultato: il competitor in prima posizione, il tuo contenuto retrocesso. Non perché il tuo servizio sia peggiore — ma perché il tuo contenuto non risponde alla domanda che l’utente ha fatto.

Questo schema si ripete ogni volta che hai una pagina “ombrello”: copre l’argomento, non risponde a nessuna domanda specifica. Esattamente il profilo che il reranker penalizza.

Il collegamento con la visibilità AI

Capire il reranking cambia il modo in cui pensi alla visibilità AI. Non basta essere indicizzati. Non basta essere rilevanti in senso vago. Devi essere il contenuto che risponde meglio alla domanda specifica che l’utente sta facendo — e devi farlo nel blocco che il reranker esamina.

Gao et al. (2024) lo dicono in modo netto:

“Re-ranking the retrieved information to relocate the most relevant content to the edges of the prompt is a key strategy.”

“Edges of the prompt” — i bordi del contesto che il generatore riceve. Il sistema non solo riordina, ma posiziona il contenuto più rilevante nelle posizioni privilegiate della finestra di contesto, quelle che il modello generativo pesa di più. Se il tuo contenuto non passa il reranking, non è che finisce in fondo alla lista — non entra nel contesto.

Da questo segue che ottimizzare per il reranking significa ottimizzare per la risposta. Non per l’argomento, non per il settore, non per la keyword: per la risposta alla domanda specifica che l’utente farà. È la stessa logica della ricerca ibrida — ma applicata a un livello di precisione ancora superiore.

Cosa fare concretamente per sopravvivere al reranking

Mappa le domande, non gli argomenti: per ogni pagina del tuo sito, identifica la domanda specifica a cui risponde. Non “i nostri servizi SEO” (argomento) ma “come scegliere un consulente SEO per un ecommerce” (domanda). Se non riesci a formulare una domanda specifica, quella pagina è vulnerabile.

La risposta va nel primo paragrafo: il reranker valuta la corrispondenza tra query e contenuto. Se la risposta alla domanda è nell’introduzione, il punteggio di rilevanza è alto. Se è sepolta al quinto punto di una lista a pagina 2, il punteggio crolla.

Heading come domande o risposte dirette: “Come scegliere un consulente SEO per ecommerce: 5 criteri concreti” batte “I nostri servizi SEO per ecommerce” in ogni sistema di reranking, perché la corrispondenza con la query dell’utente è esplicita già nell’heading.

Elimina il filler pre-risposta: introduzioni generiche sul settore, contesto storico non necessario, frasi di raccordo — tutto ciò che precede la risposta effettiva abbassa il rapporto segnale/rumore del chunk. Il reranker lo vede.

Crea pagine specifiche invece di pagine ombrello: se hai una pagina “Servizi” con 10 servizi elencati, il reranker non sa a quale domanda risponde. Dieci pagine specifiche — una per ogni servizio, ognuna che risponde a “cos’è, a chi serve, quando usarlo” — moltiplicano le tue possibilità di essere selezionato per le query rilevanti.

Non fare affidamento su un singolo test: i sistemi di reranking variano tra i motori AI e la stocasticità fa sì che la stessa query dia risultati diversi in momenti diversi. Testa su più piattaforme, più volte, e considera i pattern ricorrenti — non le singole istanze.

Come verificare dove stai perdendo

Il test più rapido: prendi la query per cui vuoi apparire e cercala su tre motori AI diversi. Annota le fonti citate. Poi leggi quei contenuti come farebbe un reranker — rispondono direttamente alla domanda? Come si confrontano con il tuo contenuto?

Se le fonti citate sono più specifiche della tua pagina, il problema è chiaro. Il reranker sta facendo il suo lavoro, e tu stai perdendo al secondo filtro nonostante sia passato al primo.

Il test più approfondito: per ogni pagina chiave, identifica la domanda a cui dovrebbe rispondere. Poi guarda il tuo primo paragrafo — risponde in modo diretto? Se ci vuole più di 30 secondi per arrivare alla risposta, quella pagina ha un problema strutturale che il reranking evidenzierà senza pietà.

Come ti spiego nell’articolo su grounding e citazione, la pipeline non finisce qui — ma se perdi al reranking, non arrivi mai al passaggio successivo.

Parti dalla tua pagina più importante: riesci a formulare in una frase la domanda a cui risponde? Se sì, quella risposta è nel primo paragrafo? Se no a uno dei due, hai il punto esatto dove intervenire.

Dopo il retrieval c’è il reranking: ecco dove i contenuti generici perdono