I backlink non servono solo a Google: l’AI li usa nel training per pesare le fonti

Stai ancora puntando a tanti backlink da blog piccoli e directory generiche? Per l'AI non funziona così. Nel corpus usato per il training, i link da fonti autorevoli — università, media nazionali, directory professionali — pesano come voti di qualità. Mille link da siti sconosciuti valgono meno di dieci menzioni su domini che il training data conosce già. Riorientare la strategia di link building verso i domini giusti non richiede più budget, richiede priorità diverse. Ti spiego quali domini puntare e perché.

Se ti occupi di visibilità online, la parola “backlink” ti fa pensare a una cosa sola: Google. PageRank, link juice, anchor text ottimizzate. E per anni e stato così — il link era il voto che un sito dava a un altro, e Google contava i voti.

Ma c’e un passaggio che vedo ignorare da quasi tutti i professionisti con cui parlo. I modelli AI — quelli che alimentano le risposte di ChatGPT, Perplexity, Gemini — non usano PageRank. Non hanno un algoritmo che conta i link in tempo reale. Eppure i backlink contano anche per loro, e in un modo che cambia completamente la prospettiva su dove investire il tuo tempo.

Il grafo dei link come rete di citazioni nel corpus

Partiamo da un dato di fatto: i modelli vengono addestrati su enormi quantità di testo raccolto dal web. E quel testo non e un insieme di pagine isolate. Ogni pagina contiene link ad altre pagine. Quei link sono parte del testo che il modello processa durante il training.

Da questo segue una deduzione importante, e ci tengo a renderla esplicita perché non e un fatto dimostrato da un singolo esperimento, ma un ragionamento logico basato sulla meccanica del training. Quando una pagina autorevole linka a un’altra pagina nel contesto di un argomento specifico, il modello processa quell’associazione. Non come “voto” in senso algoritmico, ma come co-occorrenza contestuale: la fonte A menziona e collega la fonte B parlando del tema X. Se questo pattern si ripete — più fonti autorevoli che linkano allo stesso dominio parlando dello stesso tema — il modello sviluppa un’associazione statistica tra quel dominio e quel tema.

In pratica, i backlink funzionano nel training data come citazioni accademiche funzionano nella ricerca: non sono un voto generico di qualità, ma un segnale contestuale che dice “su questo argomento, questa fonte e rilevante”.

Perché i link da fonti autorevoli pesano di più

Non tutti i backlink hanno lo stesso impatto nel training. E qui entra un principio che nel mondo accademico e consolidato da decenni: il peso di una citazione dipende da chi cita.

Un paper del 2023 di Aggarwal et al. ha misurato qualcosa di molto concreto sull’effetto delle citazioni nella visibilità AI:

“Including citations, quotations from relevant sources, and statistics can significantly boost source visibility in generative engine responses, with visibility improvements exceeding 40 percent.”Aggarwal et al., 2023

Quel 40% di miglioramento di visibilità non e un numero teorico — e una misura sperimentale. E il principio che ne deriva e diretto: le fonti che vengono citate da altre fonti rilevanti ottengono più visibilità nelle risposte AI. Non perché l’AI “segua il link” come fa un crawler. Ma perché nel corpus di addestramento, quella rete di citazioni costruisce un peso statistico che il modello incorpora.

Tradotto nel tuo caso: un backlink dal Sole 24 Ore che ti menziona come esperto nel tuo settore non vale solo per il traffico referral o per la SEO tradizionale. Vale perché quel testo — con il tuo nome, il tuo dominio, il contesto tematico — finisce nel corpus di training. E il modello lo processa.

Il bias strutturale verso le fonti terze

C’e un secondo elemento che rende questo meccanismo ancora più rilevante. Un’analisi del 2025 degli stessi Aggarwal et al. ha documentato un pattern sistematico:

“AI Search exhibit a systematic and overwhelming bias towards Earned media — third-party, authoritative sources — over Brand-owned and Social content.”Aggarwal et al., 2025

Questo cambia le priorità in modo netto. I contenuti che pubblichi sul tuo sito sono necessari, ma da soli non bastano a costruire il peso che ti serve. L’AI privilegia strutturalmente le menzioni che arrivano da fonti terze autorevoli — esattamente il tipo di fonti che generano backlink di qualità.

Se ci pensi, ha una logica precisa. Il modello durante il training ha processato miliardi di pagine. Le pagine brand-owned (il tuo sito, i tuoi social) dicono tutte la stessa cosa: “siamo bravi”. Le pagine di fonti terze che ti menzionano dicono qualcosa di diverso: “questa fonte e rilevante per questo argomento”. Per il modello, il secondo segnale e più informativo del primo. E il peso statistico riflette questa asimmetria.

Come i backlink alimentano il knowledge graph dell’AI

Il meccanismo non si ferma al training statico. Nei sistemi RAG — quelli che cercano informazioni in tempo reale prima di rispondere — i link tra fonti giocano un ruolo nel modo in cui il sistema costruisce la rappresentazione della conoscenza.

Sundriyal et al. nel 2026 descrivono un passaggio tecnico che vale la pena leggere:

“The retrieved web evidence is then aligned with the KG schema and merged with the KG subgraph to construct an augmented, multi-source knowledge representation.”Sundriyal et al., 2026

Il punto chiave e “multi-source knowledge representation”. Il sistema non prende una singola fonte e la presenta come risposta. Recupera più fonti, le allinea con il knowledge graph esistente e costruisce una rappresentazione integrata. In questo processo, le fonti che sono collegate tra loro — che si citano a vicenda, che si linkano — formano una rete più densa e coerente. E una rete più densa trasmette più fiducia al sistema.

Questo si collega direttamente a quello che approfondiro nell’articolo sul Knowledge Panel: essere un’entita riconosciuta nel knowledge graph significa esistere come nodo in questa rete. I backlink da fonti autorevoli sono uno dei modi in cui quel nodo si rafforza.

Dove investire: la logica del training data

Alla luce di tutto questo, la domanda pratica diventa: quali backlink contano davvero per la visibilità AI?

La risposta e diversa da quella della SEO tradizionale. Non conta il volume — contano due cose: la probabilita che la fonte sia nel training data, e il contesto tematico del link.

Un link da un dominio .edu, da un media nazionale, da una directory professionale di settore o da una pubblicazione tecnica ha un peso sproporzionato. Non perché il dominio .edu abbia un “bonus” algoritmico, ma perché questi domini hanno un’altissima probabilita di essere inclusi nei dataset di addestramento. Un link da un blog sconosciuto con 50 visite al mese, anche se tematicamente rilevante, ha una probabilita molto più bassa di finire nel corpus.

E il contesto conta. Un link nella pagina “partner” di un sito autorevole, senza testo intorno, trasmette meno segnale di un link dentro un articolo approfondito che parla del tuo tema e ti menziona come fonte. Il modello processa il testo intorno al link — il contesto semantico e parte del segnale.

Un esercizio che puoi fare subito: prendi i tuoi 10 backlink più autorevoli e chiediti per ciascuno — questo dominio ha probabilita di essere nel training data di un LLM? Se la risposta e si per almeno la meta, stai costruendo nella direzione giusta. Se la risposta e si per uno o due, il grosso del tuo profilo link sta lavorando solo per Google, non per l’AI. E un check di superficie, ma ti da una fotografia immediata di dove sei.

Non e più solo link building: e citation building

Il punto di svolta e questo: per l’AI, il backlink non e un voto meccanico. E una citazione contestuale. E come ogni citazione, il suo valore dipende da chi cita, in che contesto, e quanto quel pattern si ripete nel corpus.

Questo significa che la strategia cambia. Non serve accumulare centinaia di link da directory generiche. Serve costruire un profilo di citazioni — poche, mirate, da fonti con alta probabilita di essere nel training data, in contesti tematicamente rilevanti.

La topical authority del tuo dominio si rafforza quando fonti esterne confermano la tua competenza su un tema specifico. La content recency entra in gioco perché i sistemi RAG recuperano fonti aggiornate — e se le menzioni più recenti che ti riguardano sono fresche, il segnale e più forte. E le implicit reference — le menzioni testuali senza link — completano il quadro, perché il modello processa il testo, non solo l’ipertesto.

E meccanica, non opinione. Chi costruisce una rete di citazioni autorevoli e contestuali sta costruendo un asset che funziona su due livelli: la SEO tradizionale e la visibilità AI. Chi continua a comprare link a pacchetto sta investendo su un solo livello — e quello meno importante per il futuro.

Roberto Serra

Mi chiamo Roberto Serra e sono un digital marketer con una forte passione per la SEO: Mi occupo di posizionamento sui motori di ricerca, strategia digitale e creazione di contenuti.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Quanto è visibile il tuo brand per le AI? Analizza il tuo brand