Claude non naviga: se non sei nel suo training, per lui non esisti

Hai lavorato su schema markup pulito, freschezza dei contenuti, struttura semantica. Tutto giusto — ma solo se stai parlando a ChatGPT o Perplexity. Claude nella versione base non naviga il web: risponde dal training data. Se il tuo brand non era nel corpus quando Anthropic ha addestrato il modello, per Claude non esisti. Non importa quanto sia aggiornato il tuo sito adesso. Non è un problema di ottimizzazione tecnica: è un problema di presenza storica su fonti stabili. Ti spiego quali fonti pesano nel training data di Claude e dove devi costruire la tua traccia.

Apri Claude.ai, attiva web search, chiedi del tuo settore. Ora conta: quante fonti ti includono nel suo report? Zero? Abbiamo il problema.

Perché se nella sua versione base Claude non naviga il web — e nei piani gratuiti e in buona parte delle integrazioni API è così — l’unica cosa a cui può attingere per parlare del tuo brand è il suo training data. Se non sei nel corpus su cui Anthropic ha addestrato il modello, per Claude semplicemente non esisti. Punto.

Nei miei articoli su ChatGPT e Perplexity ti ho spiegato come funziona il retrieval live, lo schema, la freschezza. Con Claude cambia la regola: conta la presenza storica sul web, non la freschezza. Ti spiego perché questo ribalta la strategia per chi vuole uscire nelle risposte AI.

Come Claude costruisce le sue risposte quando non naviga

Nel mondo dei modelli linguistici di grandi dimensioni esiste una distinzione netta: modelli con retrieval live (che leggono il web al momento della domanda) e modelli che rispondono dalla sola memoria, cioè dai pesi appresi durante il training.

Claude, nella sua forma base, appartiene alla seconda categoria. Anthropic ha aggiunto la web search come funzionalità opzionale, ma non è attiva di default su tutti i piani e non è sempre presente nelle integrazioni API che le aziende usano per costruire i loro assistenti interni.

Quando Claude risponde senza browsing, sta facendo un’operazione diversa rispetto a Perplexity. Non cerca, non recupera, non confronta fonti attuali. Sta ricostruendo una risposta usando ciò che ha assorbito durante l’addestramento: testi di siti web, Wikipedia, pubblicazioni accademiche, libri, forum tecnici, documentazione aperta.

Tradotto: se il tuo brand non era nel corpus al momento del training, Claude non può citarti. Non perché non ti voglia citare — perché non ti conosce.

Perché questo meccanismo cambia la strategia rispetto a ChatGPT e Perplexity

Negli articoli precedenti ti ho raccontato come ChatGPT e Perplexity funzionino in larga parte per retrieval-augmented generation: cercano il web, prendono le pagine, le leggono, costruiscono la risposta. In quello scenario contano la freschezza del contenuto, lo schema markup pulito, la velocità di indicizzazione.

Con Claude senza browsing, il gioco cambia. Il tuo sito potrebbe avere lo schema markup perfetto e una struttura a piramide rovesciata esemplare: se il training data non ti ha mai visto, Claude non ti cita. E viceversa: un competitor con un sito tecnicamente mediocre ma presente su Wikipedia, con menzioni su pubblicazioni storiche del settore, verrà citato.

Da questo segue una conseguenza operativa forte: per Claude la presenza storica e la densità di citazioni su fonti stabili pesa più delle ottimizzazioni tecniche recenti. Conta il segnale che riesci a lasciare sul web in modo che venga raccolto nei grandi corpora di training.

Il test di reverse engineering che puoi fare in 15 minuti

Ti racconto il test che uso per capire se un brand è “dentro” Claude o no. Si chiama reverse engineering della web search di Claude: anche quando Claude naviga, il modello tende a suggerire e confermare ciò che già conosce dal training. Se nel training non ci sei, anche la web search fatica a pescarti con autorevolezza.

Ecco i passaggi.

  • Apri Claude.ai, attiva la web search.
  • Fai una domanda neutra sul tuo settore (non il tuo brand). Esempio per un produttore di nduja e insaccati piccanti di Vibo Valentia: “Quali sono i produttori artigianali di nduja calabrese con lavorazione tradizionale?”
  • Leggi la risposta. Segna i brand citati nel corpo del testo e le fonti elencate in fondo.
  • Poi chiedi esplicitamente: “Esiste un produttore di nduja a Vibo Valentia chiamato [nome del tuo brand]?”
  • Osserva: Claude ti conferma con dettagli specifici (sede, lavorazione, prodotti), ti dà risposta generica, o dice che non ha informazioni?

Se risponde con dettagli precisi → sei nel training o in fonti affidabili che la web search ha trovato rapidamente. Se risponde vago o negativo → non ci sei, o ci sei in modo troppo flebile.

Questo è un test indicativo, non uno studio. Il campione è piccolo e la risposta di Claude varia tra sessioni. Ma è un primo passo: l’analisi vera richiede strumenti professionali e una serie di query ripetute nel tempo.

Il test che ho fatto sul settore nduja calabrese

Ti racconto un reverse engineering recente. Ho preso il settore dei produttori di nduja e insaccati piccanti di Vibo Valentia e Spilinga (che è il cuore geografico della nduja DOP) e ho fatto 12 query diverse su Claude con web search attiva. Domande del tipo: “migliori produttori artigianali di nduja a Vibo Valentia”, “aziende storiche di insaccati piccanti calabresi”, “dove comprare nduja di Spilinga autentica online”.

Su 12 risposte, 4 brand ricorrevano in almeno 8 query su 12. Erano gli stessi quattro, sempre. Altri 5-6 produttori comparivano occasionalmente (2-3 volte su 12). Il resto del mercato — decine di aziende reali con e-commerce attivi, partite IVA agricole, presenza su Google Maps — non compariva mai.

Ho controllato i quattro brand ricorrenti. Cosa avevano in comune? Pagina Wikipedia dedicata o citazione su pagine Wikipedia di categoria (nduja, salumi calabresi). Menzioni su Gambero Rosso, Slow Food, riviste di settore con archivio pubblico. Citazioni storiche su blog di food italiani con anzianità superiore ai 10 anni.

Gli altri, anche quelli con ottimi siti e-commerce e schema markup pulito, non c’erano. Campione piccolo, pattern chiaro: per Claude, la longevità della presenza testuale sul web conta più dell’ottimizzazione tecnica attuale.

Gli errori che vedo più spesso su chi vuole entrare nel training di Claude

Quattro pattern li vedo ricorrere in praticamente ogni settore B2C italiano.

Puntare solo sul sito aziendale aggiornato. Un sito appena rifatto, per quanto perfetto tecnicamente, probabilmente non era nel training del modello. Il segnale di “esistenza per Claude” si costruisce su fonti terze stabili, non sul tuo dominio.

Ignorare Wikipedia e Wikidata. Questi due sono nel training di praticamente tutti i modelli AI commerciali. Se il tuo brand o il tuo settore non ha voci lì (o non è linkato da voci lì), stai lasciando sul tavolo il segnale più forte. Da Wikidata parte metà della conoscenza strutturata dei modelli, come ho spiegato nell’articolo sul Google Knowledge Graph.

Confondere traffico SEO con presenza nei corpora. Ricevere 50.000 visite al mese da Google non significa essere nel training di Claude. I crawler di Anthropic e gli aggregatori come Common Crawl raccolgono secondo logiche loro. Un blog di nicchia con 2.000 visite al mese ma citato da Wikipedia pesa più del tuo e-commerce da 100k visite.

Non curare le citazioni “implicite”. Il principio dell’implicit reference weight vale doppio per Claude: ogni menzione del tuo brand in testi di terzi, anche senza link, costruisce la tua presenza. Come anche i backlink funzionano da citation proxy per i modelli.

Cosa fare concretamente per essere dentro il training

Non è una ricetta magica e non basta da sola. Ma queste azioni muovono l’ago.

  • Costruire o migliorare la presenza su Wikipedia: voce del brand se notoriamente rilevante, altrimenti menzioni in voci di categoria (per la nduja: voce “Nduja”, “Cucina calabrese”, “Spilinga”).
  • Aprire o completare la scheda su Wikidata: entità del brand con proprietà (sede, fondazione, categoria merceologica). È la spina dorsale entità per Claude.
  • Pubblicare o farsi citare su testate di settore con archivio pubblico di lunga durata (Gambero Rosso, Dissapore, Slow Food, riviste locali storicizzate). Archivio pubblico significa che Common Crawl e simili possono leggerle.
  • Curare la reputazione dell’autore come entità: se il fondatore è una figura pubblica con storia, le sue interviste storicizzate parlano anche del brand.
  • Partecipare a eventi di settore con pubblicazione atti o stampa — il principio dell’event entity speaking authority moltiplica le menzioni su fonti stabili.

Nessuna di queste è veloce. Il training di Claude 3.5 o successive versioni ha un cutoff a una certa data: quello che pubblichi oggi entrerà nel training solo in versioni future del modello, nell’ordine di 12-24 mesi. Per questo, contrariamente a Perplexity dove la freschezza ha valore immediato, per Claude stai investendo nel medio periodo.

Dove andiamo da qui nella serie sulle piattaforme AI

Uscire nelle risposte AI non è un gioco unico: ogni motore AI ha regole diverse. Claude privilegia la memoria profonda del training, ChatGPT mescola memoria e retrieval, Perplexity vive di retrieval puro, Gemini pesa il grafo di Google. Capire la differenza ti permette di allocare budget dove serve: content storicizzato per Claude, schema e freschezza per Perplexity, Knowledge Graph per Gemini.

Nei prossimi articoli della serie su piattaforme AI guardiamo nel dettaglio come cambia la strategia retrieval tra ChatGPT e Perplexity, e come Gemini usa la telemetria di Search. Il filo è sempre lo stesso: capire il meccanismo per decidere dove investire per uscire nelle risposte AI.

Quanto è visibile il tuo brand per le AI?

Scoprilo in 30 secondi con il nostro tool gratuito. 11 check automatici, risultati immediati.

Roberto Serra

Mi chiamo Roberto Serra e sono un digital marketer con una forte passione per la SEO: Mi occupo di posizionamento sui motori di ricerca, strategia digitale e creazione di contenuti.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Quanto è visibile il tuo brand per le AI? Analizza il tuo brand