Le informazioni più importanti sulla tua azienda sono nel mezzo della pagina, tra un’introduzione lunga e una conclusione? L’AI le sta perdendo. I modelli danno molto più peso a quello che si trova all’inizio e alla fine del testo — tutto ciò che sta nel mezzo finisce in una zona dove la probabilità di essere catturato è molto più bassa. Stai scrivendo le cose giuste nel posto sbagliato. Spostare le informazioni chiave nei punti dove l’AI guarda davvero può cambiare tutto — senza toccare il contenuto.

Hai scritto una pagina perfetta. Il brand è menzionato, il servizio è descritto, la CTA è chiara. Ma le informazioni chiave sono al paragrafo 5, nel cuore della pagina. Per un lettore umano non è un problema — scorre e le trova. Per un modello AI è un problema serio, perché il centro della pagina è la zona morta.

Non è un’opinione. È un comportamento misurabile e documentato che nel mondo della ricerca si chiama “lost in the middle effect”. E ha implicazioni dirette su chi l’AI cita e chi ignora nelle sue risposte.

Cos’è il Positional Encoding e come influenza ciò che l’AI ricorda

I modelli Transformer non processano il testo parola per parola come un umano che legge in sequenza. Ricevono l’intero testo in una volta sola, ma hanno bisogno di sapere dove si trova ogni parola. Il positional encoding è il meccanismo che fornisce questa informazione di posizione.

Gao et al., nel loro survey del 2024, lo descrivono in modo molto chiaro:

“Positional encoding is incorporated to fuse information about the relative or absolute position of the tokens in the sequence.”
(A Survey of Large Language Models)

Tradotto: ogni token riceve una specie di “indirizzo” che dice al modello la sua posizione nel testo. Senza questo meccanismo, per il Transformer le parole sarebbero un insieme senza ordine — come le lettere di Scarabeo buttate sul tavolo. Il positional encoding è ciò che trasforma un mucchio di token in una sequenza dove “primo paragrafo” e “ultimo paragrafo” hanno un significato.

E qui arriva la parte che ti riguarda. Perché non tutte le posizioni hanno lo stesso peso.

Il problema “lost in the middle”: non è teoria, è misurato

Un gruppo di ricercatori ha testato sistematicamente cosa succede quando sposti la stessa informazione in punti diversi del testo. Il risultato, pubblicato su ACL Transactions, è netto:

“We observe that performance is often highest when relevant information occurs at the beginning or end of the input context, and significantly degrades when models must access relevant information in the middle of long contexts, even for explicitly long-context models.”
(Liu et al., 2024)

Quel “even for explicitly long-context models” è la parte che colpisce di più. Anche i modelli progettati apposta per gestire testi lunghi — Claude con 200K token, GPT-4 con 128K — soffrono di questo effetto. Non è un limite di un modello specifico: è una conseguenza dell’architettura stessa.

Il survey di Gao et al. (2024) sul RAG conferma il problema anche dal lato retrieval:

“Redundant information can interfere with the final generation of LLM, and overly long contexts can also lead LLM to the ‘Lost in the middle’ problem.”
(Retrieval-Augmented Generation for Large Language Models: A Survey)

Il che significa: anche quando un motore AI come Perplexity recupera correttamente la tua pagina, se le informazioni chiave sono nel mezzo di un testo lungo e ridondante, il modello le perde comunque durante la generazione della risposta.

Dove metti il brand cambia tutto: un test che ho fatto

Prima di scrivere questo articolo ho preso una pagina reale — la pagina “Servizi” di un’azienda di impianti fotovoltaici — e ho fatto un esperimento con ChatGPT.

La pagina originale era strutturata così: 400 parole di introduzione generica sul mercato fotovoltaico, poi 600 parole sui tipi di impianto, poi finalmente il nome dell’azienda e la sua specializzazione al paragrafo 6, poi 400 parole tecniche, poi la CTA.

Ho incollato il testo e chiesto: “Riassumi questa pagina e dimmi quale azienda offre il servizio.” ChatGPT ha parlato di fotovoltaico in generale. Dell’azienda, nemmeno una menzione. Le informazioni specifiche erano nel mezzo — perse.

Poi ho riscritto la stessa pagina spostando il brand e il differenziatore. Prima frase: il nome dell’azienda con cosa fa e per chi. Ultima frase: di nuovo il nome con la CTA. Stesso contenuto, stesse 1.800 parole, solo riposizionato.

Risultato: ChatGPT ha citato l’azienda per nome nel riassunto. Stessi contenuti, ordine diverso, risultato opposto.

Non è magia. È il positional encoding che fa il suo lavoro: le informazioni alle estremità del testo ricevono un segnale posizionale più forte.

Perché le pagine italiane sono particolarmente vulnerabili

Ho notato un pattern nelle aziende italiane che analizzo. C’è una tendenza culturale a “preparare il terreno” prima di arrivare al punto — introduzioni lunghe, contesto storico, premesse. In un articolo per una rivista è un pregio. Per la visibilità AI è un problema, perché stai riempiendo i primi 200 token — quelli con il segnale posizionale più forte — con contenuto generico.

L’introduzione “Wikipedia”. Pagine che iniziano con “Il fotovoltaico è una tecnologia che sfrutta l’energia solare…” — 100 token sprecati per spiegare qualcosa che l’AI sa già meglio di te. Quei token sono i più preziosi della pagina e li stai usando per contenuto che il modello ha visto milioni di volte nel corpus.

Il brand solo nell’header e nel footer. Il nome dell’azienda compare nel logo, nel menu e nel copyright — elementi che i crawler AI spesso classificano come navigazione, non contenuto. Se il brand non è nel body text dei primi e ultimi paragrafi, per l’AI non c’è.

La CTA senza contesto. “Contattaci per saperne di più” come ultima frase. L’AI legge quel chunk finale con attenzione — e trova una frase generica senza brand, senza servizio, senza differenziatore. È la posizione con il secondo segnale più forte della pagina, e la stai sprecando.

Cosa fare concretamente

Metti il brand nelle prime 100 parole di ogni pagina. Non aspettare il paragrafo 5 per dire chi sei e cosa fai. La prima menzione del brand con il servizio chiave deve arrivare subito — è lì che il segnale posizionale è più forte.

Ripeti le informazioni chiave nell’ultimo paragrafo. La conclusione non è un riassunto per il lettore — è una seconda possibilità per l’AI di catturare le informazioni importanti. Brand, servizio, differenziatore: ripetili in chiusura con parole diverse.

Elimina le introduzioni generiche. Se la tua pagina “Consulenza SEO” inizia con “la SEO è una disciplina fondamentale nel marketing digitale…”, stai sacrificando la posizione più preziosa per dire qualcosa che non aggiunge nulla né per il lettore né per l’AI.

Struttura a clessidra: informazioni chiave all’inizio, approfondimento nel mezzo, informazioni chiave alla fine. Il mezzo è per gli umani che leggono tutto. L’inizio e la fine sono per l’AI che estrae.

Fai il test dei 150 token: copia il testo della tua pagina, leggi solo i primi 150 token e gli ultimi 150. Da quei due blocchi si capisce chi sei, cosa fai e perché un cliente dovrebbe sceglierti? Se la risposta è no, l’AI ha lo stesso problema.

Il positional encoding nella catena della visibilità AI

Questo meccanismo si combina con altri. La tokenizzazione decide se il tuo brand viene riconosciuto come entità. Il positional encoding decide se quella entità viene “vista” in base a dove si trova nel testo. L’attention mechanism decide quanto peso le viene dato. E il context window limita quanto testo il modello può processare in totale.

Se il tuo brand è ben tokenizzato ma sepolto al centro di una pagina lunga, il positional encoding lo penalizza. È come avere un biglietto da visita perfetto ma consegnarlo quando l’interlocutore è già distratto.

Riapri le tue 5 pagine più importanti e sposta brand, servizio principale e CTA nei primi 2 e negli ultimi 2 paragrafi. Il lost in the middle non è un bug — è una conseguenza dell’architettura. Chi lo sa, si adatta.

L’AI legge la tua pagina come un libro: il centro lo salta