Parlare la lingua di ogni AI

Claude non naviga: se non sei nel suo training, per lui non esisti

Roberto Serra 14 Aprile 2026·~8 min di lettura

Claude — uno dei principali assistenti AI usati in azienda — non naviga il web quando risponde: parla solo di quello che ha letto durante l'addestramento. Se il tuo brand non era già presente su fonti stabili prima di quell'addestramento, per Claude semplicemente non esisti — indipendentemente da quanto sia aggiornato il tuo sito oggi. Ogni query di un potenziale cliente che usa Claude è una conversazione in cui il tuo nome non compare mai, mentre i competitor che hanno costruito presenza storica vengono citati al posto tuo. Sapere dove costruire quella traccia cambia completamente la partita.

Apri Claude.ai, attiva web search, chiedi del tuo settore. Ora conta: quante fonti ti includono nel suo report? Zero? Abbiamo il problema.

Perché se nella sua versione base Claude non naviga il web — e nei piani gratuiti e in buona parte delle integrazioni API è così — l’unica cosa a cui può attingere per parlare del tuo brand è il suo training data. Se non sei nel corpus su cui Anthropic ha addestrato il modello, per Claude semplicemente non esisti. Punto.

Nei miei articoli su ChatGPT e Perplexity ti ho spiegato come funziona il retrieval live, lo schema, la freschezza. Con Claude cambia la regola: conta la presenza storica sul web, non la freschezza. Ti spiego perché questo ribalta la strategia per chi vuole uscire nelle risposte AI.

Come Claude costruisce le sue risposte quando non naviga

Nel mondo dei modelli linguistici di grandi dimensioni esiste una distinzione netta: modelli con retrieval live (che leggono il web al momento della domanda) e modelli che rispondono dalla sola memoria, cioè dai pesi appresi durante il training.

Claude, nella sua forma base, appartiene alla seconda categoria. Anthropic ha aggiunto la web search come funzionalità opzionale, ma non è attiva di default su tutti i piani e non è sempre presente nelle integrazioni API che le aziende usano per costruire i loro assistenti interni.

Quando Claude risponde senza browsing, sta facendo un’operazione diversa rispetto a Perplexity. Non cerca, non recupera, non confronta fonti attuali. Sta ricostruendo una risposta usando ciò che ha assorbito durante l’addestramento: testi di siti web, Wikipedia, pubblicazioni accademiche, libri, forum tecnici, documentazione aperta.

Tradotto: se il tuo brand non era nel corpus al momento del training, Claude non può citarti. Non perché non ti voglia citare — perché non ti conosce.

Perché questo meccanismo cambia la strategia rispetto a ChatGPT e Perplexity

Negli articoli precedenti ti ho raccontato come ChatGPT e Perplexity funzionino in larga parte per retrieval-augmented generation: cercano il web, prendono le pagine, le leggono, costruiscono la risposta. In quello scenario contano la freschezza del contenuto, lo schema markup pulito, la velocità di indicizzazione.

Con Claude senza browsing, il gioco cambia. Il tuo sito potrebbe avere lo schema markup perfetto e una struttura a piramide rovesciata esemplare: se il training data non ti ha mai visto, Claude non ti cita. E viceversa: un competitor con un sito tecnicamente mediocre ma presente su Wikipedia, con menzioni su pubblicazioni storiche del settore, verrà citato.

Da questo segue una conseguenza operativa forte: per Claude la presenza storica e la densità di citazioni su fonti stabili pesa più delle ottimizzazioni tecniche recenti. Conta il segnale che riesci a lasciare sul web in modo che venga raccolto nei grandi corpora di training.

Errore comune

Confondere traffico SEO con presenza nei corpora.

Il test di reverse engineering che puoi fare in 15 minuti

Ti racconto il test che uso per capire se un brand è “dentro” Claude o no. Si chiama reverse engineering della web search di Claude: anche quando Claude naviga, il modello tende a suggerire e confermare ciò che già conosce dal training. Se nel training non ci sei, anche la web search fatica a pescarti con autorevolezza.

Ecco i passaggi.

Apri Claude.ai, attiva la web search.
Fai una domanda neutra sul tuo settore (non il tuo brand). Esempio per un produttore di nduja e insaccati piccanti di Vibo Valentia: “Quali sono i produttori artigianali di nduja calabrese con lavorazione tradizionale?”
Leggi la risposta. Segna i brand citati nel corpo del testo e le fonti elencate in fondo.
Poi chiedi esplicitamente: “Esiste un produttore di nduja a Vibo Valentia chiamato [nome del tuo brand]?”
Osserva: Claude ti conferma con dettagli specifici (sede, lavorazione, prodotti), ti dà risposta generica, o dice che non ha informazioni?

Se risponde con dettagli precisi → sei nel training o in fonti affidabili che la web search ha trovato rapidamente. Se risponde vago o negativo → non ci sei, o ci sei in modo troppo flebile.

Questo è un test indicativo, non uno studio. Il campione è piccolo e la risposta di Claude varia tra sessioni. Ma è un primo passo: l’analisi vera richiede strumenti professionali e una serie di query ripetute nel tempo.

Pro tip

Aprire o completare la scheda su Wikidata: entità del brand con proprietà (sede, fondazione, categoria merceologica).

Il test che ho fatto sul settore nduja calabrese

Ti racconto un reverse engineering recente. Ho preso il settore dei produttori di nduja e insaccati piccanti di Vibo Valentia e Spilinga (che è il cuore geografico della nduja DOP) e ho fatto 12 query diverse su Claude con web search attiva. Domande del tipo: “migliori produttori artigianali di nduja a Vibo Valentia”, “aziende storiche di insaccati piccanti calabresi”, “dove comprare nduja di Spilinga autentica online”.

Su 12 risposte, 4 brand ricorrevano in almeno 8 query su 12. Erano gli stessi quattro, sempre. Altri 5-6 produttori comparivano occasionalmente (2-3 volte su 12). Il resto del mercato — decine di aziende reali con e-commerce attivi, partite IVA agricole, presenza su Google Maps — non compariva mai.

Ho controllato i quattro brand ricorrenti. Cosa avevano in comune? Pagina Wikipedia dedicata o citazione su pagine Wikipedia di categoria (nduja, salumi calabresi). Menzioni su Gambero Rosso, Slow Food, riviste di settore con archivio pubblico. Citazioni storiche su blog di food italiani con anzianità superiore ai 10 anni.

Gli altri, anche quelli con ottimi siti e-commerce e schema markup pulito, non c’erano. Campione piccolo, pattern chiaro: per Claude, la longevità della presenza testuale sul web conta più dell’ottimizzazione tecnica attuale.

Gli errori che vedo più spesso su chi vuole entrare nel training di Claude

Quattro pattern li vedo ricorrere in praticamente ogni settore B2C italiano.

Puntare solo sul sito aziendale aggiornato. Un sito appena rifatto, per quanto perfetto tecnicamente, probabilmente non era nel training del modello. Il segnale di “esistenza per Claude” si costruisce su fonti terze stabili, non sul tuo dominio.

Ignorare Wikipedia e Wikidata. Questi due sono nel training di praticamente tutti i modelli AI commerciali. Se il tuo brand o il tuo settore non ha voci lì (o non è linkato da voci lì), stai lasciando sul tavolo il segnale più forte. Da Wikidata parte metà della conoscenza strutturata dei modelli, come ho spiegato nell’articolo sul Google Knowledge Graph.

Confondere traffico SEO con presenza nei corpora. Ricevere 50.000 visite al mese da Google non significa essere nel training di Claude. I crawler di Anthropic e gli aggregatori come Common Crawl raccolgono secondo logiche loro. Un blog di nicchia con 2.000 visite al mese ma citato da Wikipedia pesa più del tuo e-commerce da 100k visite.

Non curare le citazioni “implicite”. Il principio dell’implicit reference weight vale doppio per Claude: ogni menzione del tuo brand in testi di terzi, anche senza link, costruisce la tua presenza. Come anche i backlink funzionano da citation proxy per i modelli.

Cosa fare concretamente per essere dentro il training

Non è una ricetta magica e non basta da sola. Ma queste azioni muovono l’ago.

Costruire o migliorare la presenza su Wikipedia: voce del brand se notoriamente rilevante, altrimenti menzioni in voci di categoria (per la nduja: voce “Nduja”, “Cucina calabrese”, “Spilinga”).
Aprire o completare la scheda su Wikidata: entità del brand con proprietà (sede, fondazione, categoria merceologica). È la spina dorsale entità per Claude.
Pubblicare o farsi citare su testate di settore con archivio pubblico di lunga durata (Gambero Rosso, Dissapore, Slow Food, riviste locali storicizzate). Archivio pubblico significa che Common Crawl e simili possono leggerle.
Curare la reputazione dell’autore come entità: se il fondatore è una figura pubblica con storia, le sue interviste storicizzate parlano anche del brand.
Partecipare a eventi di settore con pubblicazione atti o stampa — il principio dell’event entity speaking authority moltiplica le menzioni su fonti stabili.

Nessuna di queste è veloce. Il training di Claude 3.5 o successive versioni ha un cutoff a una certa data: quello che pubblichi oggi entrerà nel training solo in versioni future del modello, nell’ordine di 12-24 mesi. Per questo, contrariamente a Perplexity dove la freschezza ha valore immediato, per Claude stai investendo nel medio periodo.

Dove andiamo da qui nella serie sulle piattaforme AI

Uscire nelle risposte AI non è un gioco unico: ogni motore AI ha regole diverse. Claude privilegia la memoria profonda del training, ChatGPT mescola memoria e retrieval, Perplexity vive di retrieval puro, Gemini pesa il grafo di Google. Capire la differenza ti permette di allocare budget dove serve: content storicizzato per Claude, schema e freschezza per Perplexity, Knowledge Graph per Gemini.

Nei prossimi articoli della serie su piattaforme AI guardiamo nel dettaglio come cambia la strategia retrieval tra ChatGPT e Perplexity, e come Gemini usa la telemetria di Search. Il filo è sempre lo stesso: capire il meccanismo per decidere dove investire per uscire nelle risposte AI.

Capitolo 6 · Parlare la lingua di ogni AI

Prosegui la lettura degli approfondimenti

40 approfondimenti, divisi nelle 5 sezioni del capitolo.

6.1 ChatGPT & OpenAI 8 approfondimenti

Come ChatGPT cita le fonti (e perché il tuo brand deve entrare nel testo, non in footnote) Quando ChatGPT ti cita senza linkarti: il trade-off del referral pattern La ricetta di ChatGPT: dove è finito il tuo brand nel suo training data OpenAI Plugins & Actions: quando l’AI non ti consiglia, ti usa GPT Store: l’ecosistema di plugin che raccomanda i brand senza che tu lo sappia GPT Store e Custom GPT: come diventare la fonte di default nel tuo settore ChatGPT Browse Mode: perché le risposte live passano da Bing (e cosa cambia per te) ChatGPT: Architettura di Risposta

6.2 Google Gemini & SGE 8 approfondimenti

Google Vertex AI ed Enterprise Search: come finire nelle risposte che pescano dal web Google Merchant Center e AI Shopping: come far citare i tuoi prodotti da Gemini e SGE Google Quality Rater Guidelines: il manuale che Google usa anche per le risposte AI Gemini Extensions & Workspace: perché il tuo contenuto dentro Drive, Gmail e YouTube diventa un canale diretto nelle risposte AI Google Perspective & Discussion: quando Gemini ascolta Reddit prima del tuo sito Google AI Overviews e snippet selection: perché Gemini sceglie un brand e ignora l’altro Gemini e il Knowledge Graph: perché Google ti conosce prima ancora di rispondere Google SGE e AI Overview: come funziona davvero l’architettura e cosa cambia per il tuo posizionamento

6.3 Perplexity 8 approfondimenti

Perplexity Focus Modes: come non sparire quando l’utente cambia filtro Perplexity Pro e Free citano fonti diverse: perché il tuo cliente potrebbe non vederti Perplexity Pages: gli articoli AI che Google indicizza (e perché ti interessano) Sei primo su Google ma invisibile su Perplexity? Controlla il robots.txt Perplexity Spaces e Collections: il micro-canale di raccomandazione che puoi possedere Come Perplexity sceglie le fonti che cita (e perché il tuo sito non c’è) Perplexity Citation Pattern: come funziona davvero la selezione delle fonti Perplexity real-time RAG: perché il tuo sito può entrare nelle risposte oggi, non fra sei mesi

6.4 Claude & Anthropic 4 approfondimenti

Claude e Artifacts: come finire nelle analisi che il modello genera per il tuo settore Claude non naviga: se non sei nel suo training, per lui non esisti Sei qui Claude e i 200K token: perché le guide complete vincono dove i contenuti corti spariscono Claude, l’editor paranoico: come il filtro costituzionale decide chi citare

6.5 Bing Copilot & Altri 12 approfondimenti

AI Evolution Monitoring: come tenere il passo con i cambiamenti dei motori AI senza impazzire AI in Social Media (TikTok, Instagram): come i tuoi video diventano risposte dentro le app Voice AI: come uscire nelle risposte di Alexa, Google Home e Siri AI aggregator e meta-search: perché essere visibile solo su ChatGPT non basta più Platform-specific content strategy: perché un contenuto unico non basta più Cross-Platform Consistency: perché il tuo brand deve raccontare la stessa storia su ogni AI AI Search nei marketplace: le tue schede prodotto sono già la fonte delle risposte AI AI Chatbot Verticali: perché essere nel dataset di nicchia vale più di mille backlink Apple Intelligence e Siri AI: il canale invisibile che è appena arrivato su ogni iPhone Meta AI su Instagram: il motore AI che i tour operator di Pompei stanno ignorando Microsoft Copilot in Office 365: come finire nelle presentazioni e nelle email dei tuoi buyer Bing Copilot e l’ecosistema Microsoft: perché il tuo brand deve esserci

L'autore

Roberto Serra al Senato della Repubblica

Senato della Repubblica · Palazzo Giustiniani Convegno “Il potere dell'intelligenza artificiale”

Roberto Serra

Consulente SEO da oltre 15 anni, fondatore dell'Agenzia SEO Serra (RAANK). Aiuta multinazionali e PMI a restare visibili dove la ricerca si sta spostando: ChatGPT, Perplexity, Gemini e gli AI Overviews di Google.

Ne hanno parlato

Scopri di più su Roberto Serra →