Named Entity Recognition: come l’AI decide se il tuo brand è “qualcuno” o solo testo

Se il tuo brand non viene riconosciuto come entità nominata dall'AI, per il modello è come se non avessi un nome: sei testo generico, indistinguibile da "nostre soluzioni industriali". Non è un problema di autorità né di contenuti — è un meccanismo tecnico che si chiama Named Entity Recognition, e si verifica prima di qualsiasi altra valutazione. In 10 minuti puoi testarlo con strumenti gratuiti come displaCy o l'API di Google NLP. Ti spiego come capire se il tuo brand viene classificato come ORG o PERSON, e cosa cambiare se il test lo promuove a rumore di fondo.

Immagina un titolare di una PMI meccanica che digita su ChatGPT “migliori produttori di componenti industriali in Lombardia”. L’AI risponde con cinque nomi. Il suo non c’è. Non perché sia peggiore dei concorrenti citati — ma perché per il modello AI il suo brand, letteralmente, non esiste come entità riconosciuta. È una stringa di testo come un’altra, non “qualcuno di cui parlare”.

Questo è il meccanismo che ti spiego oggi. Si chiama Named Entity Recognition, e decide a monte se il tuo brand ha il diritto di apparire nelle risposte AI o se resta rumore di fondo.

Cosa sono le “entità” per un modello AI

Quando ChatGPT, Claude o Perplexity leggono un documento, non vedono parole: vedono pezzi di testo che vanno etichettati. Alcuni sono nomi comuni, altri sono nomi propri — e questi ultimi attivano un riconoscimento specifico.

Nel mondo della ricerca, Villena et al. (2024) definiscono il meccanismo così:

“One interesting task in natural language processing (NLP) is named entity recognition (NER), which seeks to detect mentions of relevant information in documents.”Villena et al. (2024)

Tradotto: il sistema non “legge” tutto allo stesso modo. Cerca attivamente menzioni di informazioni rilevanti — persone, aziende, luoghi, prodotti — e le separa dal resto.

La conseguenza operativa è semplice. Se nel tuo sito il brand “TecnoImpianti Soluzioni Industriali” compare solo come testo normale, senza segnali strutturali che lo identifichino come un’organizzazione, per il modello è indistinguibile da “nostre soluzioni industriali”. Non entra nello scaffale delle entità riconosciute, e quando l’AI cerca “a chi rivolgermi”, non ti trova.

Gli stessi autori precisano cosa si intende per entità:

“NER is the task of finding spans of text that constitute named entities (anything that can be referred to with a proper name) and tagging the entity type.”Villena et al. (2024)

In pratica: qualsiasi cosa si possa chiamare per nome proprio — e a cui si possa assegnare una categoria (persona, azienda, luogo).

Perché NER sta a monte di tutto il resto che ti ho spiegato

Negli articoli precedenti ti ho parlato di come i modelli spezzano il testo in token e di come ogni concetto vive in uno spazio vettoriale. La Named Entity Recognition viene prima: è il filtro che decide cosa merita di diventare un concetto ancorato e cosa resta testo scorrevole.

Ti faccio l’esempio che uso sempre con i clienti. Se scrivi “Studio Associato Rossi fornisce consulenza fiscale a Padova”, un sistema con NER attivo etichetta “Studio Associato Rossi” come ORGANIZATION, “Padova” come LOCATION. Diventano ancore. L’AI ora sa che esiste un’organizzazione con quel nome in un luogo specifico, e può citarla quando qualcuno chiede di commercialisti padovani.

Se invece il testo è “il nostro studio fornisce consulenza fiscale nella nostra città”, nessuna entità viene estratta. Per il modello non esiste un soggetto specifico da citare. Ed è per questo che la struttura con piramide rovesciata funziona solo se i soggetti sono identificabili.

Le quattro categorie che i sistemi riconoscono più spesso sono documentate in modo esplicito:

“The four most common entity types are person, location, organization, and geopolitical entity.”Villena et al. (2024)

Da questo segue che, per un brand B2B italiano, i due attributi che contano davvero sono ORGANIZATION (il nome dell’azienda) e PERSON (i nomi di founder, CEO, autori dei contenuti). Se entrambi non vengono estratti, sei invisibile come soggetto.

Il test che puoi fare in 10 minuti senza essere tecnico

Ti do la procedura che faccio fare a tutti i miei clienti come primo check. Non sostituisce un audit vero, ma ti dice in 10 minuti se hai un problema evidente.

Apri displaCy ENT (è un riconoscitore di entità gratuito nel browser): demos.explosion.ai/displacy-ent.

Incolla nel box una frase tipica della tua homepage o della pagina “chi siamo”. Qualcosa come: “Automeccanica Lecce produce ricambi per macchine utensili dal 1978 e collabora con il Politecnico di Torino”.

Premi Parse. Il tool colora le entità trovate e le etichetta. Tre esiti possibili:

  • Il tuo brand è colorato come ORG: sei riconoscibile. Buon segnale di partenza.
  • Il tuo brand è colorato ma come PERSON o MISC: riconosciuto ma classificato male. Problema di ambiguità.
  • Il tuo brand non è colorato: il sistema non lo vede come entità. Qui c’è lavoro da fare.

Attenzione: questo è un test entry level. Usa un modello generalista inglese, non conosce tutte le PMI italiane e non fotografa ciò che ChatGPT o Gemini sanno davvero del tuo brand. L’analisi vera richiede strumenti professionali e confronti cross-motore. Ma se fallisci anche questo, hai una certezza: i segnali base non ci sono.

Dopo il test NER, verifica anche il lato schema. Apri il Rich Results Test di Google, incolla l’URL della homepage, e cerca la parola “Organization” nel report. Se compare, stai dando al web un segnale strutturato chiaro. Se non compare, stai lasciando al caso il riconoscimento del tuo brand come organizzazione.

Il test che ho fatto io su 40 PMI italiane

Ho preso 40 siti di PMI italiane B2B (meccanica, studi professionali, e-commerce di nicchia) e ho passato homepage + pagina “chi siamo” su displaCy ENT. Poi ho fatto la stessa verifica con strumenti professionali di NER multilingua.

Risultato: su 40 brand, 14 sono stati riconosciuti come ORG in modo stabile (35%). Altri 11 sono stati riconosciuti ma con etichetta ambigua — a volte ORG, a volte MISC, a volte PERSON (27%). I restanti 15, circa il 38%, non sono stati estratti come entità in nessun test.

Il pattern che si è ripetuto nei 15 “invisibili”: nomi brand troppo descrittivi (“Soluzioni Ambientali Integrate”), mancanza di schema Organization sulla homepage, e zero voci Wikidata collegate.

Due avvertenze oneste: è un test indicativo, non uno studio accademico. Il campione non è grande, e i risultati variano tra motori AI diversi — ma il pattern sui brand “descrittivi-senza-schema” è troppo chiaro per essere casuale.

Gli errori che vedo più spesso

Nei brief di audit che ricevo, quattro pattern si ripetono sempre.

Brand descrittivo non distinguibile. Il nome è una frase generica tipo “Consulenza Ambientale Professionale Srl”. Il sistema NER lo legge come descrizione di un servizio, non come nome proprio. Soluzione: usa il nome breve e distintivo in posizione iniziale, poi la descrizione.

Zero schema Organization. La homepage non contiene markup strutturato che dica “questa pagina parla di un’organizzazione con questo nome, questo indirizzo, questo sito”. Per il web è una pagina come un’altra.

Nome brand usato in forme troppo variabili. “TecnoImpianti”, “Tecno Impianti S.r.l.”, “Tecnoimpianti Soluzioni” nella stessa pagina. Il riconoscitore non sa quale sia la forma canonica. Scegline una e sii coerente.

Founder senza identità. Il CEO o il titolare non compare mai con nome e cognome insieme a titolo professionale e azienda. Questo collega anche a quello che ti ho scritto sul riconoscimento dell’autore come entità: se la persona non è un’entità, l’azienda perde un pezzo di credibilità agli occhi del modello — un tema che si lega direttamente a come funziona E-E-A-T per l’AI.

Cosa fare concretamente, in ordine di priorità

Non serve una rivoluzione. Servono quattro mosse in sequenza:

  • Testa le frasi chiave della homepage e della pagina “chi siamo” su displaCy ENT. Segnati quali entità vengono riconosciute e quali no.
  • Apri il Rich Results Test sulla homepage. Se non trovi “Organization” nel report, aggiungi lo schema strutturato con nome legale, sito, indirizzo, logo.
  • Normalizza il nome brand: una sola forma canonica, usata in modo coerente su title, H1, footer, contatti.
  • Crea o completa la voce Wikidata del brand e collega l’URL ufficiale. È il modo più diretto per dire al web “questa stringa è un’entità reale, ecco i suoi attributi”.
  • Confronta il risultato con i 3-5 competitor che l’AI cita quando fai la domanda generica sul tuo settore. Se loro compaiono e tu no, il delta è quasi sempre nei quattro punti sopra.

Gli autori del paper ricordano un dettaglio che vale anche per chi non fa NER professionale:

“For training NER models, one needs a large corpus of task-specific annotated text, but constructing an annotated corpus is both time-consuming and expensive.”Villena et al. (2024)

Tradotto in pratica: costruire un riconoscitore di entità su misura è costoso, ed è il motivo per cui i modelli AI moderni si appoggiano a conoscenza condivisa (Wikidata, schema.org, citazioni in fonti autorevoli). Se vuoi essere riconosciuto come entità, il tuo brand deve essere documentato fuori dal tuo sito, non solo dentro.

NER non è un fattore magico e non basta da solo. Ma sta a monte: se qui sei assente, tutti gli investimenti successivi in contenuti e authority portano meno risultato di quanto potrebbero.

Dove continua il discorso

Questo è il primo articolo della serie sull’Entity & Knowledge Graph, la parte del lavoro GEO che decide se il tuo brand è un soggetto citabile nelle risposte AI o una stringa di testo qualsiasi. Nei prossimi articoli ti porto dentro i meccanismi collegati: come funzionano entity linking e disambiguation, cos’è davvero un knowledge graph e come Wikidata influenza la tua visibilità nei sistemi AI.

Il filo resta lo stesso: essere visibili nelle risposte AI non è questione di “contenuti migliori” in astratto. È questione di essere riconosciuti come qualcuno di cui si può parlare. NER è il primo cancello.

Quanto è visibile il tuo brand per le AI?

Scoprilo in 30 secondi con il nostro tool gratuito. 11 check automatici, risultati immediati.

Roberto Serra

Mi chiamo Roberto Serra e sono un digital marketer con una forte passione per la SEO: Mi occupo di posizionamento sui motori di ricerca, strategia digitale e creazione di contenuti.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Quanto è visibile il tuo brand per le AI? Analizza il tuo brand