Diventare una fonte di cui l'AI si fida

Pubblichi sul tuo tema da 10 anni? L’AI lo sa e ti premia

Roberto Serra 13 Aprile 2026·~8 min di lettura

Hai cancellato i vecchi articoli per fare ordine sul sito? Potresti aver eliminato il tuo vantaggio competitivo più difficile da ricostruire. L'AI riconosce da quanto tempo una fonte pubblica su un argomento: chi ha uno storico lungo e coerente su un tema ha un'autorità che un sito nuovo non può comprare a nessun prezzo. Stai regalando anni di lavoro. Recuperare e aggiornare quello che hai già richiede meno sforzo di riscrivere da zero — e i risultati durano.

C’è una cosa che non puoi comprare, non puoi simulare e non puoi accelerare: il tempo. E nel modo in cui i modelli AI decidono di chi fidarsi, il tempo conta più di quanto immagini.

Se pubblichi contenuti sul tuo settore da anni, stai accumulando un vantaggio invisibile. Se invece sei arrivato ieri su un tema con un blog appena aperto e dieci articoli scritti in fretta, l’AI lo percepisce. Non perché legga le date dei tuoi post, il meccanismo è più sottile di così.

L’archivio storico come asset strategico

Prima di spiegarti il meccanismo, voglio che tu capisca la posta in gioco. Quando un potenziale cliente chiede a Perplexity “chi sono i migliori consulenti per X nel mio settore”, il sistema recupera fonti, le valuta e costruisce la risposta. In quel momento, una fonte che ha pubblicato contenuti rilevanti su quel tema per cinque anni consecutivi trasmette un segnale diverso da una che è apparsa sei mesi fa.

Non è un giudizio soggettivo dell’AI. È una conseguenza diretta di come i modelli vengono addestrati e di come i sistemi RAG selezionano le fonti.

Come nasce l’autorità temporale: il training data

Per capire perché il tempo conta, devi partire da come i modelli imparano. Ogni LLM viene addestrato su un corpus enorme di testi, raccolti in momenti diversi. Questo corpus non è uno snapshot unico: è il risultato di più crawl successivi, a distanza di mesi o anni.

Un paper del 2024 di Cheng et al. ha indagato cosa succede davvero dentro i modelli rispetto alle risorse su cui sono stati addestrati:

“We seek to probe LLMs to determine their resource-level effective cutoffs, defining the effective cutoff date of a model with respect to a resource as the date of the version of the resource that is most closely aligned with the model.”

Cheng et al., 2024

Il concetto chiave è “effective cutoff date with respect to a resource”, ogni risorsa ha la sua data di cutoff effettiva. Non esiste un unico cutoff per tutto il modello. Il modello potrebbe avere informazioni aggiornate al 2024 su un argomento popolare e ferme al 2021 su un altro.

Questo significa che il modello non tratta tutte le fonti come uguali. Una risorsa che è stata inclusa nel corpus in più versioni successive, perché esisteva già nel crawl del 2020, del 2022 e del 2024, ha una presenza stratificata nella memoria del modello. Il modello l’ha “vista” più volte, in contesti diversi, con aggiornamenti progressivi.

Da questo segue una deduzione importante: le fonti che pubblicano sullo stesso tema da anni, aggiornandosi regolarmente, hanno più probabilità di essere state incluse in versioni successive del corpus di training. E ogni inclusione rinforza il peso di quella fonte nella conoscenza interna del modello.

Errore comune

I tuoi competitor probabilmente non sanno che il loro archivio di blog post del 2018 è un asset per la visibilità AI, e molti lo stanno cancellando per “ripulire il sito”.

Il legame con il knowledge cutoff

Se hai letto il mio articolo sul knowledge cutoff, sai già che il cutoff non è una data netta ma una zona grigia. Il cutoff effettivo varia da risorsa a risorsa.

Ora aggiungi un tassello: se il cutoff effettivo dipende da quante versioni di una risorsa sono finite nel corpus, allora una fonte con dieci anni di pubblicazioni sullo stesso tema ha avuto dieci anni di opportunità per essere inclusa. Una fonte nata l’anno scorso ne ha avuta una sola, nella migliore delle ipotesi.

Non è un’opinione, è la conseguenza logica del meccanismo di costruzione dei training data. I crawler raccolgono il web periodicamente. Chi c’era prima, è stato raccolto più volte. Chi c’era più volte, pesa di più nel modello. Chi pesa di più nel modello, viene recuperato con più facilità quando il modello deve costruire una risposta.

Pro tip

Ecco la prima regola pratica: non cancellare mai i vecchi contenuti.

Cosa succede nei sistemi RAG

La temporal authority non agisce solo sul training data. Agisce anche nel momento in cui i sistemi RAG, quelli che alimentano Perplexity, Bing Chat e le AI Overview di Google, decidono quali fonti recuperare e con quale priorità.

Quando un sistema RAG cerca fonti per rispondere a una query, valuta diversi segnali di qualità. Tra questi, la profondità e coerenza tematica di un dominio conta. Un sito che ha 50 articoli sullo stesso tema, pubblicati nell’arco di 5 anni, con date di pubblicazione e aggiornamento visibili, trasmette un segnale di competenza consolidata. Un sito con 10 articoli tutti datati lo stesso mese trasmette un segnale diverso.

I segnali E-E-A-T, Esperienza, Competenza, Autorevolezza, Affidabilità, che l’AI eredita come proxy di fiducia, hanno una componente temporale intrinseca. L’esperienza, per definizione, richiede tempo. Non puoi dimostrare dieci anni di esperienza con un sito nato tre mesi fa, per quanto i contenuti siano impeccabili.

Il training data bias rafforza il pattern

C’è un altro elemento che amplifica questo meccanismo. Ne ho parlato nell’articolo sul training data bias: i dati di addestramento non sono un campione neutro del web. Alcune fonti sono sovra-rappresentate, altre sotto-rappresentate.

Le fonti con una lunga storia editoriale tendono ad avere più pagine indicizzate, più backlink, più menzioni su piattaforme terze. Tutti fattori che aumentano la probabilità di essere incluse nei dataset di training. Questo crea un circolo virtuoso: chi pubblica da più tempo ha più pagine, più pagine significano più inclusioni nel training, più inclusioni significano più peso nel modello.

E quando il modello deve decidere tra due fonti che dicono cose simili, il consensus signal gioca a favore di chi è già radicato. La fonte storica è più probabile che sia allineata con il consenso del settore, semplicemente perché ha contribuito a formarlo.

Cosa significa per chi parte da zero

Se stai leggendo e pensi “allora per me è troppo tardi”, fermati. Non funziona così.

L’autorità temporale è un vantaggio cumulativo, non una barriera d’ingresso assoluta. Chi parte oggi può costruirla, ma deve sapere che il risultato non arriva in tre mesi. La buona notizia è che quasi nessuno nel tuo settore sta pensando a questo in modo strategico. I tuoi competitor probabilmente non sanno che il loro archivio di blog post del 2018 è un asset per la visibilità AI, e molti lo stanno cancellando per “ripulire il sito”.

Ecco la prima regola pratica: non cancellare mai i vecchi contenuti. Se hai articoli datati, aggiornali. Aggiungi la data di prima pubblicazione e la data di ultimo aggiornamento. Un articolo pubblicato nel 2019 e aggiornato nel 2026 comunica al crawler: “questa fonte ha sette anni di storia su questo tema e lo tiene aggiornato”.

Come costruire la tua autorità temporale

La strategia cambia a seconda di dove ti trovi.

Se hai un archivio storico, il lavoro è di valorizzazione. Riprendi i vecchi articoli tematici, aggiornali con dati attuali, mantieni la data di prima pubblicazione e aggiungi dateModified nello schema markup. Non riscriverli da zero: l’aggiornamento progressivo è più efficace della sostituzione, perché preserva la continuità che il crawler riconosce.

Se parti da zero, il lavoro è di costruzione metodica. Scegli un tema specifico, non cinque, uno solo per iniziare, e pubblica con costanza. Non serve un articolo al giorno. Serve un articolo al mese, ma per tre anni. La costanza nel tempo è più potente del volume nel breve periodo.

In entrambi i casi, assicurati che la tua presenza tematica non sia solo sul tuo sito. La reputazione cross-platform amplifica il segnale temporale: se il tuo nome compare da anni anche su directory di settore, profili professionali e media verticali, il segnale di autorità si moltiplica.

Se disponi già dei contenuti adatti, assicurati che siano facilmente citabili. Il modo più semplice per aumentare la loro “citabilità” consiste nell’aggiungere un breve riepilogo all’inizio della pagina: due o tre frasi autosufficienti, scritte con un tono autorevole e dichiarativo, che menzionino esplicitamente le entità principali.

Assicurati inoltre che i modelli linguistici possano effettivamente eseguire il crawling e il rendering del tuo sito web. Non nascondere i contenuti più importanti dietro codice JavaScript!
Malte Landwehr, Esperto SEO e AEO di Peec AI, su SEO Confidential

I check da fare subito

Puoi iniziare a farti un’idea della tua situazione con qualche verifica di base.

Apri il tuo sito e controlla la data dell’articolo più vecchio sul tuo tema principale. Poi vai su Wayback Machine (web.archive.org) e verifica da quando il tuo dominio pubblica contenuti su quell’argomento. Se trovi una storia di 5+ anni con contenuti tematici coerenti, hai un vantaggio che forse non sapevi di avere.

Poi fai la stessa verifica sui tuoi competitor diretti. Chi ha una storia più lunga sul tema? Chi ha l’archivio più profondo? Questo ti dice contro chi stai combattendo per la temporal authority nel tuo settore.

Sono check di superficie, per un quadro preciso di come il tuo brand è rappresentato nei training data servono strumenti e competenze specifiche. Ma ti danno una direzione.

Il tempo è l’unico asset che non si può replicare

Oggi l’AI decide sempre più spesso quali brand menzionare nelle risposte, la storia editoriale è un differenziatore strutturale. Non si compra, non si fabbrica con un mese di contenuti intensivi, non si simula.

Chi ha pubblicato sul proprio tema per anni sta seduto su un vantaggio che cresce a ogni crawl, a ogni nuova versione dei dataset di training, a ogni aggiornamento dei modelli. Chi inizia oggi può costruirlo, ma deve sapere che il tempo è parte della formula.

Capitolo 2 · Diventare una fonte di cui l'AI si fida

Prosegui la lettura degli approfondimenti

40 approfondimenti, divisi nelle 5 sezioni del capitolo.

2.1 Trust & Reputazione 9 approfondimenti

Una controversia sul web può farti sparire dalle risposte AI per mesi Perplexity non cita chiunque: ha un filtro qualità che devi superare Se l’AI riconosce il tuo nome come esperto, ogni tuo contenuto sale Pubblichi sul tuo tema da 10 anni? L’AI lo sa e ti premia Sei qui Quando tutti gli esperti dicono la stessa cosa, l’AI la presenta come verità Il tuo sito è eccellente ma l’AI non ti conosce? Potrebbe essere un bias del training L’AI usa la pagella E-E-A-T di Google per decidere di chi fidarsi L’autorità AI non è permanente: se non la mantieni, decade 5 stelle su Google, 2 su Trustpilot: l’AI vede la contraddizione

2.2 Segnali di Autorità 8 approfondimenti

Hai un Knowledge Panel su Google? Per l’AI sei un’entità riconosciuta 50 articoli su un tema battono 500 articoli su tutto: la topical authority per l’AI Anche senza link, ogni menzione del tuo brand ha un peso per l’AI Non tutte le validazioni valgono uguale: la gerarchia di trust per l’AI Quando un esperto del tuo settore ti menziona, l’AI registra il segnale I dati strutturati sono la carta d’identità del tuo sito per l’AI L’articolo aggiornato ieri batte quello perfetto di 2 anni fa I backlink non servono solo a Google: l’AI li usa nel training per pesare le fonti

2.3 Fonti & Citazioni 7 approfondimenti

Un libro con ISBN è il formato con il trust score più alto per l’AI Essere citati su un sito .gov equivale a una certificazione per l’AI Paper accademici, Wikipedia, media: la gerarchia delle fonti per l’AI Le raccomandazioni spontanee degli utenti pesano più di qualsiasi tuo contenuto L’AI sa distinguere un esperto vero da uno autoproclamato Wikipedia è la fonte che tutti i modelli AI consultano per prima Dati che solo tu hai: l’arma definitiva per la visibilità AI

2.4 Brand Authority 8 approfondimenti

Il sito dice ‘leader dal 2005’, LinkedIn dice ‘fondato nel 2012’: l’AI lo nota Review, follower, case study: l’AI li somma tutti in un punteggio unico L’iscrizione alla tua associazione di categoria è un segnale per l’AI L’AI ha 3-5 posti nelle risposte: come prendi il posto di un competitor L’autorità del CEO si trasferisce all’azienda (e viceversa): l’AI lo vede Ripeti brand + categoria ovunque: l’AI costruisce l’associazione per te Per le query locali l’AI dà un peso enorme ai segnali geografici Nomi diversi su piattaforme diverse? L’AI frammenta la tua autorità

2.5 Credibilità Tecnica 8 approfondimenti

Senza HTTPS il tuo sito non esiste per i sistemi RAG Contenuti anonimi senza fonte? Per l’AI è un red flag L’accessibilità del tuo sito è un proxy di qualità anche per l’AI La data di aggiornamento del tuo contenuto è un segnale che l’AI legge Un API endpoint pubblico rende il tuo business integrabile dall’AI HTML semantico sbagliato = l’AI non capisce la gerarchia del tuo contenuto Stai bloccando GPTBot in robots.txt? Allora sei invisibile per ChatGPT I crawler AI hanno timeout più aggressivi di Google: la tua pagina è abbastanza veloce?

L'autore

Roberto Serra al Senato della Repubblica

Senato della Repubblica · Palazzo Giustiniani Convegno “Il potere dell'intelligenza artificiale”

Roberto Serra

Consulente SEO da oltre 15 anni, fondatore dell'Agenzia SEO Serra (RAANK). Aiuta multinazionali e PMI a restare visibili dove la ricerca si sta spostando: ChatGPT, Perplexity, Gemini e gli AI Overviews di Google.

Ne hanno parlato

Scopri di più su Roberto Serra →