I tuoi contenuti più importanti non hanno un autore visibile, non citano fonti e non riportano la data di pubblicazione? Non è un problema estetico — è un segnale di inaffidabilità per i modelli AI. Durante il training, i sistemi vengono ottimizzati per preferire contenuti con autore identificabile, fonti citate e data visibile. I contenuti anonimi e non verificabili ricevono meno peso nelle risposte, indipendentemente dalla qualità di quello che scrivi. Aggiungere byline con schema Person, citare le fonti e rendere visibili le date è lavoro di qualche ora. Ti spiego come strutturare i segnali di authorship verificabile che aumentano la selezionabilità del tuo contenuto.
Hai un blog aziendale con trenta articoli. Nessuno e firmato. Nessuno cita una fonte. Non c’e una data di pubblicazione visibile, non c’e una bio dell’autore, non c’e niente che dica al mondo chi ha scritto quelle parole e perché dovrebbe fidarsi. Per un lettore umano magari non cambia molto — legge, valuta, decide. Per un modello AI che deve scegliere quali fonti citare nella risposta, quell’assenza di contesto e un segnale preciso. E non e un segnale positivo.
Questo e l’ultimo articolo del percorso su authority e credibilità per l’AI. In tutto quello che ti ho raccontato finora — dall’E-E-A-T alla reputazione cross-platform, dal markup semantico alla crawlability — c’e un filo che attraversa ogni argomento: i sistemi AI cercano fonti di cui fidarsi. E la fiducia si costruisce con segnali verificabili. L’authorship verificata e il punto dove tutti questi fili convergono.
La credibilità non e un’opinione: ha dei parametri
C’e una tendenza a trattare la credibilità come qualcosa di vago. “Contenuti di qualità”, “fonti autorevoli” — frasi che si sentono ovunque e non significano niente di preciso. La ricerca, però, ha provato a dare una definizione operativa.
Srba et al. nel loro survey del 2024 sulla credibilità dell’informazione nell’era AI hanno analizzato cosa rende un contenuto credibile agli occhi di chi lo valuta:
“Human studies show that context-based signals — presence of links, publisher, author — contribute most towards human judgement of credibility.” — Srba et al., 2024
Leggi bene: “context-based signals”. Non la qualità del testo in se. Non quanto e lungo l’articolo o quanto e sofisticato il linguaggio. Quello che pesa di più nel giudizio di credibilità sono i segnali di contesto — la presenza di link, dell’editore, dell’autore. Il contenuto può essere impeccabile, ma se mancano questi segnali, la credibilità percepita scende.
E qui arriva il punto che cambia tutto per chi vuole uscire nelle risposte AI: i modelli linguistici vengono addestrati sulle preferenze umane. Se i valutatori umani considerano più credibili i contenuti con autore e fonti identificabili, il modello impara a preferirli. Non e una regola programmata — e un pattern che emerge dal training.
Come le preferenze umane diventano preferenze del modello
Ne ho parlato in diversi articoli di questo percorso, ma vale la pena riprenderlo qui perché e il meccanismo che lega tutto. Durante il training con RLHF, i valutatori umani confrontano coppie di risposte e indicano quale preferiscono. Il modello impara a produrre risposte simili a quelle scelte. E le risposte scelte tendono a citare fonti con attributi verificabili — autore, data, affiliazione.
Da questo segue — ed e una deduzione basata sul meccanismo, non un esperimento isolato su questo specifico punto — che i contenuti firmati, datati e con fonti citate hanno un vantaggio strutturale. Non perché il modello “legga” la byline e decida consciamente di premiarla. Ma perché durante migliaia di cicli di ottimizzazione, le risposte che attingevano a fonti con questi attributi venivano valutate meglio. Il pattern si e consolidato.
E non si tratta solo del training. Nei sistemi RAG — quelli che recuperano informazioni dal web in tempo reale prima di rispondere — il contenuto con autore verificabile offre un segnale aggiuntivo al processo di retrieval. Il sistema deve decidere quali passaggi includere nella risposta e quali scartare. Un passaggio con autore identificabile, fonte citata e data visibile e un passaggio con più contesto verificabile. Un passaggio anonimo, senza data e senza fonti, e un passaggio che il sistema non ha modo di valutare — e quando non puoi valutare, la scelta più sicura e non includere.
Cosa significa “autore verificabile” per un sistema AI
Attenzione a non confondere “avere una byline” con “avere un autore verificabile”. Scrivere “di Mario Rossi” in fondo a un articolo e un inizio, ma non e sufficiente. L’authorship verificata, per un modello AI, e la somma di segnali che confermano che quella persona esiste, ha competenze in quel campo e ha una presenza documentabile.
Ne ho parlato in modo approfondito nell’articolo sull’author entity recognition: quando il tuo nome e un’entita riconosciuta — con attributi, relazioni e competenze associate nel Knowledge Graph del modello — ogni contenuto che firmi parte con un vantaggio. Quando il tuo nome e una stringa senza connessioni, la byline non aggiunge quasi niente.
Per rendere l’authorship realmente verificabile servono elementi concreti. Il markup schema Person che collega il nome dell’autore alla sua bio strutturata. Una bio che includa credenziali verificabili e affiliazioni. Un profilo autore consistente tra il sito e le piattaforme esterne — LinkedIn, directory di settore, pubblicazioni. E le fonti citate nel testo, che funzionano come una rete di riferimenti incrociati: se citi fonti autorevoli e quelle fonti sono reali e verificabili, il tuo contenuto entra in un circuito di credibilità che si autorinforza.
Perché i contenuti anonimi pagano un prezzo crescente
Il problema dei contenuti anonimi non e che vengano “penalizzati” da un algoritmo esplicito. E che non forniscono al sistema nessun segnale su cui costruire fiducia. In un contesto dove i modelli devono scegliere tra milioni di fonti, l’assenza di segnali e un filtro negativo di fatto.
Pensa a come funziona dal punto di vista del retrieval. Il sistema recupera dieci passaggi rilevanti per una query. Cinque hanno autore, fonti, data. Cinque sono anonimi, senza riferimenti. A parita di contenuto, quali sceglieresti? Non serve una regola esplicita: la meccanica stessa della selezione favorisce chi fornisce più contesto. E con l’evoluzione dei sistemi verso l’agentic AI — modelli che usano strumenti, verificano fonti, incrociano dati prima di rispondere — la capacità di verificare l’authorship diventa sempre più determinante.
Questo e il trend che vedo accelerare. Non e qualcosa che puoi rimandare. Ogni contenuto chiave del tuo sito che oggi e anonimo e privo di fonti sta accumulando uno svantaggio che diventa più pesante con ogni aggiornamento dei sistemi. L’HTTPS protegge il trasporto del dato. La page experience rende il contenuto fruibile. La crawlability lo rende raggiungibile. Il markup semantico lo rende comprensibile. L’authorship verificata lo rende credibile. Sono livelli che si sommano — e senza l’ultimo, tutti gli altri perdono una parte del loro effetto.
Cosa puoi controllare oggi
Fai un inventario dei tuoi contenuti principali — quelli che vorresti che l’AI citasse nelle risposte. Per ciascuno verifica: c’e un autore con nome e cognome? C’e una bio dell’autore con credenziali reali? C’e un markup schema Person implementato correttamente? Ci sono fonti citate nel testo? C’e una data di pubblicazione visibile?
Se la risposta a una qualsiasi di queste domande e no, hai trovato il tuo punto di partenza. Non servono grandi investimenti: serve metodo. Ogni contenuto chiave deve avere queste cinque cose. Non perché lo dice una best practice generica, ma perché e così che funziona la meccanica di selezione dei sistemi AI.
Questo e un check iniziale che ti da un’idea chiara di dove sei. Però misurare quanto questi segnali impattano sul tuo posizionamento specifico nelle risposte AI, capire quali contenuti hanno priorità e costruire un profilo autore che i modelli riconoscano come entita — quello richiede un’analisi che va oltre il controllo a occhio. E il lavoro che faccio ogni giorno con chi vuole smettere di essere invisibile e iniziare a essere la fonte che l’AI cita.
Chiudere il cerchio
Questo articolo chiude il percorso su authority e credibilità per l’AI. In quaranta articoli ti ho portato dai principi fondamentali — cosa vuol dire E-E-A-T per un modello linguistico, come funziona il riconoscimento delle entita, perché la reputazione si costruisce su segnali incrociati — fino ai meccanismi tecnici che rendono tutto questo operativo: sicurezza, accessibilità, struttura, markup.
Il filo rosso e sempre stato lo stesso: l’AI non indovina chi e credibile. Lo calcola. Lo calcola sulla base di segnali che puoi controllare, ottimizzare, rafforzare. E l’authorship verificata e il segnale che tiene insieme tutti gli altri, perché senza un autore riconoscibile ogni contenuto e un frammento senza contesto — corretto forse, ma impossibile da verificare e quindi difficile da citare.
Nel prossimo pillar cambiamo prospettiva. Passiamo dal “come farti riconoscere come fonte credibile” al “come strutturare i contenuti perché l’AI li selezioni e li citi”. Se authority e credibilità sono le fondamenta, la struttura dei contenuti e l’architettura che ci costruisci sopra.