Se l'AI ti cita cento volte al mese, è probabile che l'80% di quelle citazioni venga da due o tre fonti specifiche — e se non sai quali sono, stai distribuendo il budget di comunicazione su tutto senza sapere cosa funziona davvero. Mappare le fonti che guidano le tue citazioni AI trasforma la strategia da sparare nel mucchio a investire dove c'è già un ritorno misurabile.

Delle 150 citazioni AI raccolte sul tuo brand negli ultimi 6 mesi, 3 siti ne generano il 60%. Sai quali sono? Mappare le fonti è la base di tutto il resto.

Te lo dico perché è il pattern che vedo ripetersi in modo quasi noioso ogni volta che apro il foglio di tracciamento di un cliente. La distribuzione delle fonti che alimentano le risposte AI sul tuo brand non è uniforme: poche pagine fanno il grosso del lavoro, e quasi sempre il proprietario del brand non sa nemmeno quali siano.

In questo articolo ti spiego come costruire questa mappa, perché vale ogni minuto che ci metti, e cosa farne una volta che ce l’hai davanti.

Cosa intendo per fonte di una citazione AI

Quando Perplexity, ChatGPT con browsing o Gemini rispondono a una domanda che ti riguarda, sotto la risposta (o linkati nella risposta) compaiono degli URL. Quelle sono le fonti grounding: i documenti web da cui il modello ha estratto le informazioni che sta riportando.

La mappa delle fonti è semplicemente l’elenco ordinato di quei link, raccolto su un periodo di osservazione e raggruppato per dominio, autore e tipo di contenuto. È un esercizio meccanico, non richiede laurea in data science. Ma cambia tutto quello che fai dopo.

Perché è il presupposto di qualunque misurazione seria

Negli articoli precedenti di questa serie hai visto come si conta una citazione, come si distingue un brand mention da una citation con link, come si tiene traccia della share of voice nelle risposte AI. Tutto quello sta a valle. La mappa delle fonti sta a monte: ti dice da dove arriva il segnale.

Senza la mappa stai contando i punti del campionato senza sapere quali giocatori li hanno fatti. Misuri un risultato aggregato che non puoi né replicare né difendere. Con la mappa, invece, ogni citazione diventa azionabile: sai quale pagina ha generato il segnale, e quindi sai dove rinforzare.

Il filo è quello di sempre nei miei articoli: ti interessa uscire nelle risposte AI, e per uscirci di più devi capire da dove ci stai uscendo già adesso.

Il principio sotto: i modelli non pescano a caso

Visto che qui non ho un paper da citarti puntualmente sul source mapping (è una pratica operativa più che un oggetto di ricerca accademica), ti porto la deduzione esplicita dal principio adiacente.

Nel mondo della ricerca sui sistemi di retrieval-augmented generation, il meccanismo documentato è chiaro: i modelli AI selezionano le fonti di grounding in base a segnali di autorevolezza, freschezza, allineamento semantico con la query e — sempre più — di author entity recognition e di implicit reference weight. Da questo segue che, per il tuo business, le fonti che vengono pescate sul tuo brand non sono casuali: sono il sottoinsieme dei tuoi asset web (e di quelli che parlano di te) che il sistema considera più affidabili in quel contesto.

La conseguenza operativa è netta. Se mappi le fonti vedi quali asset il sistema ha già “validato”. Quelli sono i tuoi cavalli di razza: vanno aggiornati, ampliati, linkati internamente. Tutto il resto è spesa di mantenimento.

Il test che puoi fare in 60 minuti

Ti serve un foglio Google con 5 colonne: data, query, motore AI, URL fonte, dominio fonte.

Procedura:

Apri Perplexity (è quello che ti dà sempre i link, gli altri non sempre). Lancia 15-20 query realistiche sul tuo settore in cui ti aspetti di poter comparire. Esempi per un produttore di olio extravergine biologico in Umbria: “miglior olio extravergine biologico Umbria”, “frantoi a freddo Trasimeno”, “olio EVO regalo aziendale Italia centrale”.
Per ogni risposta che ti cita o cita un competitor, copia tutti gli URL fonte nel foglio.
Ripeti su ChatGPT con browsing attivo e su Gemini, con le stesse query.
A fine settimana raggruppa per dominio. Conta le occorrenze.

Soglia binaria di lettura: se il tuo dominio compare in meno del 30% delle risposte che riguardano il tuo settore, hai un problema di copertura editoriale, non di SEO tecnica. Se compare nel 30-60% sei sulla buona strada e va difeso. Sopra il 60% sei già un’autorità riconosciuta dal sistema su quel campo semantico di query.

Check entry level onesto: questo è un primo passo manuale. L’analisi vera, su volumi grandi e con tracciamento longitudinale, richiede strumenti professionali. Ma il primo passo basta a dirti se stai investendo nella direzione giusta.

Il test che ho fatto io: 6 mesi su hotel balneari dell’Adriatico

Per scrivere questa serie ho tenuto un’osservazione longitudinale di 6 mesi su un campione di hotel balneari dell’Adriatico centrale, in particolare un boutique hotel 4 stelle a Fano (PU) e cinque suoi competitor diretti tra Senigallia, Marotta e Pesaro.

Ho lanciato ogni due settimane lo stesso set di 12 query (tipo “miglior hotel Fano vista mare”, “hotel famiglia spiaggia privata Marche”, “boutique hotel Adriatico per coppie”) su Perplexity, ChatGPT con browsing e Gemini. Ho raccolto tutte le fonti citate e le ho mappate per dominio.

Pattern che è emerso, su un campione complessivo di circa 480 risposte raccolte:

3 domini facevano il 58% delle citazioni: il sito proprietario dell’hotel di Fano, una guida turistica regionale di area marchigiana e una pagina di approfondimento di un magazine di viaggio nazionale del 2022.
I siti dei tour operator e degli aggregatori comparivano spesso, ma quasi mai venivano citati come fonte primaria sulle query “boutique” o “esperienza”; entravano sulle query transazionali pure.
Una pagina blog dell’hotel pubblicata nel 2023 sulle escursioni nel Parco San Bartolo era la singola URL più citata in assoluto, da sola.

Limiti dichiarati: campione non grande, una singola area geografica, una sola stagionalità coperta in pieno (autunno-inverno), motori AI in evoluzione continua durante il periodo di test. Pattern indicativo, non studio peer-reviewed. Ma il segnale era abbastanza chiaro da farmi rivedere insieme al cliente l’intera strategia editoriale: raddoppiare gli articoli sul modello “escursione San Bartolo” e abbandonare due filoni tematici che non producevano nemmeno una citazione in 6 mesi.

Gli errori che vedo più spesso quando parto da zero con un cliente

Ce ne sono quattro che si ripetono in modo quasi prevedibile.

Il primo è non mappare affatto: si conta il numero totale di citazioni mese su mese e ci si ferma lì. Numero che cresce, festeggiamo; numero che cala, ci preoccupiamo. Senza sapere da dove arrivano quelle citazioni stai lavorando alla cieca.

Il secondo è mappare solo il proprio dominio. Le citazioni che ti riguardano spesso passano da terzi: una guida di settore, una scheda Wikipedia, un articolo vecchio di un quotidiano locale. Quelle vanno mappate eccome, perché ti dicono dove la tua autorevolezza è stata costruita da altri (e dove conviene rafforzare la relazione).

Il terzo è ignorare le fonti datate. Trovo regolarmente articoli del 2018-2020 ancora citatissimi dai modelli AI nel 2026. Sono asset di valore dormiente: aggiornare il contenuto (con consenso dell’editore o con un articolo nuovo che lo richiama) è una delle operazioni con miglior ROI in assoluto.

Il quarto è non confrontarsi con i 3-5 competitor che l’AI cita nel tuo settore. Se sul tuo campo semantico di query l’AI cita sempre tre concorrenti e mai te, la mappa di quei tre ti dice esattamente dove ti manca presenza editoriale.

Cosa fare con la mappa una volta che ce l’hai

Tre azioni concrete, in ordine di priorità:

Raddoppia l’investimento sulle URL top: la pagina che genera più citazioni AI nel tuo dominio è il tuo asset di punta. Aggiornala ogni 2-3 mesi, allunga il contenuto, aggiungi FAQ, rinforza i link interni che puntano lì.
Recupera le fonti di terzi: se una guida o un magazine ti cita ed è ben posizionato come fonte AI, costruisci una relazione editoriale stabile. Una collaborazione che produce 2 articoli all’anno su quella testata vale più di 20 guest post su siti che l’AI non considera.
Audita le pagine “morte” per AI: le tue pagine che non compaiono mai come fonte. Decidi: meritano un rilancio editoriale (riscrittura, piramide rovesciata, autore riconoscibile)? O sono pagine di servizio che stanno bene così? Decidere in modo esplicito vale già metà del lavoro.

Dove va a finire questa mappa nel resto della misurazione

La mappa delle fonti è il punto di partenza. Una volta che ce l’hai puoi attaccare il resto dei lavori di misurazione che vedo nel tuo cruscotto di visibilità AI: il tracking della share of voice nel tempo, l’attribuzione delle conversioni alle citazioni AI, il benchmark contro i competitor. Senza la mappa, tutto il resto rimane un numero senza causa. Con la mappa, ogni metrica si lega a un’azione editoriale concreta.

Negli articoli successivi della serie ti porto avanti con il tracking longitudinale della share of voice, il modello di attribuzione che uso per legare citazioni AI a richieste qualificate e il setup di un cruscotto mensile leggibile da un imprenditore in 5 minuti.

Quanto è visibile il tuo brand per le AI?

Scoprilo in 30 secondi con il nostro tool gratuito. 11 check automatici, risultati immediati.

Analizza il tuo brand

Da quali fonti l’AI ti cita: la mappa che ti dice dove investire