Il tuo brand in italiano e in inglese sono la stessa entità per l’AI? Probabilmente no

Ho testato 15 cantine italiane che esportano in USA e UK: 12 su 15 erano visibili nelle risposte AI in italiano, invisibili in inglese. Stessa qualità, stessa storia, stesso brand — due entità slegate. Il problema non è la traduzione del sito: è che per l'AI la versione italiana e quella inglese non risultano la stessa cosa se non gliel'hai detto esplicitamente. Non è un problema di contenuti — è multi-language entity matching. Ti spiego perché succede, qual è il collegamento strutturale che manca, e come usare Wikidata multilingua per ricucire le due metà del tuo brand in meno di mezza giornata.

Ho testato 15 brand italiani del vino che esportano in USA e UK: 12 su 15 sono invisibili all’AI quando chiedi in inglese, visibili in italiano. Ecco perché.

La query era semplice. A ChatGPT, Claude e Perplexity ho chiesto — in italiano — “quali sono i migliori produttori di Amarone della Valpolicella che esportano negli Stati Uniti”. Ho poi riaperto una sessione pulita e chiesto, in inglese, “best Amarone della Valpolicella producers exporting to the US”. Stessa intenzione, stessa ricerca, lingua diversa.

Il risultato: 3 cantine su 15 comparivano in entrambe le versioni. Le altre 12 esistevano in italiano — in inglese semplicemente sparivano, sostituite quasi sempre dai soliti 4-5 nomi grossi che dominano la stampa anglofona. Non è un problema di qualità del vino. È un problema di entity matching multilingua: per l’AI, il sito italiano e quello inglese di quelle cantine erano due entità diverse, due identità slegate, due reputazioni che non si sommavano.

In questo articolo ti spiego perché succede, cosa dice la ricerca e cosa puoi fare in pratica per ricucire le due metà del tuo brand — soprattutto se esporti o stai per farlo.

Cosa significa “multi-language entity matching” per un modello AI

Quando un modello AI legge “Tenuta Santa Maria della Valpolicella” su un sito .it e “Santa Maria Valpolicella Estate” su un sito .com, deve decidere una cosa: è lo stesso produttore o sono due aziende diverse? Questa decisione si chiama entity matching cross-lingua ed è il meccanismo con cui il sistema unifica — o frammenta — l’autorità del tuo brand.

Il problema nasce da come vengono costruiti i sistemi di riconoscimento di entità in più lingue. Nel mondo della ricerca sul NER (Named Entity Recognition) multilingua, Mayhew et al. (2024) — nel paper “Universal NER: A Gold-Standard Multilingual NER Benchmark” pubblicato a NAACL 2024 (arxiv.org/abs/2311.09122) — documentano un principio che è centrale per capire il tuo problema di visibilità: il riconoscimento delle entità viene addestrato lingua per lingua, su annotazioni prodotte separatamente da parlanti madrelingua in iterazioni multiple. Non esiste un passaggio automatico che dica al modello “questa entità in italiano corrisponde a quest’altra in inglese”. Ogni lingua è un mondo annotato per conto suo.

Da questo segue una conseguenza diretta per il tuo business. Il modello impara a riconoscere “Tenuta Santa Maria” come entità quando legge un testo in italiano, e a riconoscere “Santa Maria Estate” come entità quando legge un testo in inglese. Ma che siano lo stesso nodo del knowledge graph non è un’inferenza automatica: è un collegamento che deve arrivare da fuori — da Wikidata, da schema strutturato, da pagine About che lo dichiarino esplicitamente.

Se quel collegamento non c’è, l’autorità che hai costruito in italiano — recensioni, citazioni di Gambero Rosso, interviste su testate di settore — resta confinata nella versione italiana. L’utente americano che chiede in inglese riceve una lista in cui non ci sei.

Perché questo meccanismo sta a monte di tutto il resto

Se hai seguito la serie, negli articoli precedenti ti ho raccontato come l’AI riconosce le entità nel testo (NER) e come le disambigua (entity disambiguation). Il matching multilingua è lo strato ancora sopra: non riguarda una singola occorrenza, riguarda l’identità del brand come nodo unico nel grafo della conoscenza.

È anche strettamente legato al tema dell’embedding nello spazio vettoriale. Due stringhe diverse (“Tenuta Santa Maria”, “Santa Maria Estate”) finiscono in punti diversi dello spazio vettoriale. Senza un segnale esplicito che dica “sono la stessa cosa”, l’AI le tratta come vicine ma distinte — e per un utente che cerca “best Italian wine producer” quella distanza basta a escluderti.

Il test che puoi fare in 10 minuti

Non serve un audit tecnico per capire se hai questo problema. Ti basta una mezz’ora e un bicchiere di vino (scegli tu quale).

  1. Apri Wikidata e cerca il nome della tua azienda. Se esiste un record, controlla la sezione “Also known as” in fondo: ci sono le varianti in inglese, tedesco, francese? Se c’è solo l’italiano, l’AI sta partendo con mezza informazione.
  2. Sulla tua homepage italiana e su quella inglese, apri il codice sorgente (tasto destro → visualizza sorgente) e cerca la stringa `hreflang`. Se non la trovi su entrambe, il segnale “queste due pagine rappresentano la stessa azienda in lingue diverse” non sta arrivando ai motori.
  3. Cerca nel codice della homepage la parola `sameAs`. Dovresti vedere una lista di URL — profili social, Wikipedia, Wikidata. Se la lista esiste sul sito italiano ma non su quello inglese (o viceversa), stai dicendo al motore AI che i due siti appartengono a soggetti diversi.
  4. Apri ChatGPT, Claude e Perplexity in sessioni pulite. Chiedi in italiano “chi è [nome tua azienda]”. Poi chiedi in inglese “who is [nome tua azienda]”. Confronta: stesse informazioni? Stessi fatti su anno di fondazione, sede, prodotti principali? Se le risposte divergono, hai due entità frammentate.

Soglie binarie: se fallisci 2 o più check su 4, la probabilità che l’AI ti tratti come due brand distinti è alta.

Il test che ho fatto (con limiti)

Torno ai 15 brand del vino della Valpolicella con cui ho aperto. Campione piccolo, selezione non casuale (ho preso cantine che esportano dichiaratamente negli USA, dai 50.000 ai 500.000 euro di fatturato estero stimato). È un test indicativo, non uno studio.

Su 12 cantine invisibili in inglese:

  • 11 non avevano record Wikidata con etichette multilingua
  • 9 non avevano `hreflang` correttamente implementato tra versione IT e EN
  • 12 su 12 non avevano `sameAs` cross-lingua nello schema Organization

La correlazione non prova la causa, ma il pattern è netto: le 3 cantine visibili in entrambe le lingue avevano tutte e tre record Wikidata con etichette multilingue e `sameAs` che collegava esplicitamente le due versioni linguistiche. L’analisi vera richiede strumenti professionali e campioni più ampi — ma come primo segnale, il pattern basta per iniziare.

Gli errori che vedo più spesso

Quando lavoro con brand che esportano, questi sono i pattern ricorrenti:

  • Due siti, due About Us scollegati. La pagina “Chi siamo” in italiano racconta una storia, quella inglese ne racconta un’altra (spesso semplificata). Nessuna delle due dichiara esplicitamente “this is the English version of [brand]”. L’AI non ha ancore per unire i due racconti.
  • Social media divisi per lingua senza `sameAs`. Account Instagram “@cantinarossi” per il mercato italiano, “@rossiwines” per l’estero. Legittimo, ma senza dichiarazione `sameAs` sul sito i due profili restano entità distinte.
  • Wikidata ignorata o con una sola etichetta. Il record esiste, ma solo in italiano. Nessuna label inglese, nessun alias. Per un utente anglofono che chiede a Perplexity, sei un brand senza pedigree.
  • Schema Organization duplicato ma non collegato. Il sito .it ha il suo schema con `@id` uno, il sito .com ha il suo con `@id` un altro. Nessun riferimento reciproco. Due schede, due identità.

Cosa fare concretamente

Non ti serve un progetto da sei mesi. Ti serve una settimana ben spesa:

  • Crea o aggiorna il record Wikidata della tua azienda con etichette in italiano, inglese e — se rilevante — tedesco, francese, spagnolo. Aggiungi alias comuni (il nome come lo usa la stampa estera).
  • Implementa `hreflang` tra tutte le coppie di pagine tradotte (homepage IT ↔ homepage EN, pagina prodotto IT ↔ pagina prodotto EN). Verifica con Rich Results Test che non ci siano errori.
  • Nello schema Organization di entrambi i siti, inserisci un blocco `sameAs` che include: URL della versione nell’altra lingua, Wikipedia (se esiste), Wikidata, profili social principali. Lo stesso blocco, identico, sui due siti.
  • Scrivi una pagina About in inglese che dichiari esplicitamente la continuità: “Cantina Rossi (also known as Rossi Wines for international markets) is an Italian winery based in Valpolicella”. Una frase, ma è l’ancora testuale che l’AI aggancia.
  • Confronta con i 3-5 competitor che l’AI cita nel tuo settore quando chiedi in inglese: quasi sempre vedrai che hanno Wikidata robusto e `sameAs` cross-lingua. Non è un caso.

Non è un meccanismo magico. `hreflang` e `sameAs` da soli non ti fanno comparire se non hai nulla di rilevante da dire in inglese. Ma se hai già fatto il lavoro in italiano — autorità, menzioni di stampa, recensioni — questa è la cucitura che riporta l’autorità nella versione inglese del tuo brand, dove finora non arrivava.

Dove si incastra nel tuo lavoro di visibilità AI

Il matching multilingua è uno dei nodi più sottovalutati nel lavoro di visibilità nelle risposte AI. Lo vedo spesso in aziende che hanno investito bene in E-E-A-T sul mercato domestico e poi si stupiscono di non comparire all’estero: l’autorità c’era, ma era intestata a una “persona giuridica semantica” diversa da quella che l’AI anglofona interrogava.

Nei prossimi articoli di questa serie parleremo di come costruire un Google Knowledge Graph entry solido, di come usare Wikidata come backbone semantico per il tuo brand, e di come sameAs diventi il collante che tiene insieme tutti i profili. Se il tuo brand parla più di una lingua, inizia da qui: prima unifichi l’identità, poi investi sul resto.

Quanto è visibile il tuo brand per le AI?

Scoprilo in 30 secondi con il nostro tool gratuito. 11 check automatici, risultati immediati.

Roberto Serra

Mi chiamo Roberto Serra e sono un digital marketer con una forte passione per la SEO: Mi occupo di posizionamento sui motori di ricerca, strategia digitale e creazione di contenuti.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Quanto è visibile il tuo brand per le AI? Analizza il tuo brand