Se i tuoi articoli non hanno un autore con nome e cognome, non citano fonti e non mostrano la data di pubblicazione, l’AI li tratta come materiale non verificabile — e li scarta a favore di chi ha quegli elementi in ordine. Non è una questione di stile: per i modelli AI, un contenuto senza autore visibile è un contenuto di cui non ci si può fidare, indipendentemente da quanto sia ben scritto. Il tuo competitor che firma i pezzi e cita le fonti ti supera anche con informazioni meno accurate delle tue. Correggere questo problema richiede meno di una mattina — e cambia il peso che l’AI assegna a tutto quello che hai già pubblicato.
Hai un blog aziendale con trenta articoli. Nessuno è firmato. Nessuno cita una fonte. Non c’è una data di pubblicazione visibile, non c’è una bio dell’autore, non c’è niente che dica al mondo chi ha scritto quelle parole e perché dovrebbe fidarsi. Per un lettore umano magari non cambia molto — legge, valuta, decide. Per un modello AI che deve scegliere quali fonti citare nella risposta, quell’assenza di contesto è un segnale preciso. E non è un segnale positivo.
Questo è l’ultimo articolo del percorso su authority e credibilità per l’AI. In tutto quello che ti ho raccontato finora — dall’E-E-A-T alla reputazione cross-platform, dal markup semantico alla crawlability — c’è un filo che attraversa ogni argomento: i sistemi AI cercano fonti di cui fidarsi. E la fiducia si costruisce con segnali verificabili. L’authorship verificata è il punto dove tutti questi fili convergono.
La credibilità non è un’opinione: ha dei parametri
C’è una tendenza a trattare la credibilità come qualcosa di vago. “Contenuti di qualità”, “fonti autorevoli” — frasi che si sentono ovunque e non significano niente di preciso. La ricerca, però, ha provato a dare una definizione operativa.
Srba et al. nella loro survey del 2024 sulla credibilità dell’informazione nell’era AI hanno analizzato cosa rende un contenuto credibile agli occhi di chi lo valuta:
“Human studies show that context-based signals — presence of links, publisher, author — contribute most towards human judgement of credibility.”
Leggi bene: “context-based signals”. Non la qualità del testo in sé. Non quanto è lungo l’articolo o quanto è sofisticato il linguaggio. Quello che pesa di più nel giudizio di credibilità sono i segnali di contesto — la presenza di link, dell’editore, dell’autore. Il contenuto può essere impeccabile, ma se mancano questi segnali, la credibilità percepita scende.
E qui arriva il punto che cambia tutto per chi vuole uscire nelle risposte AI: i modelli linguistici vengono addestrati sulle preferenze umane. Se i valutatori umani considerano più credibili i contenuti con autore e fonti identificabili, il modello impara a preferirli. Non è una regola programmata — è un pattern che emerge dal training.
Come le preferenze umane diventano preferenze del modello
Ne ho parlato in diversi articoli di questo percorso, ma vale la pena riprenderlo qui perché è il meccanismo che lega tutto. Durante il training con RLHF, i valutatori umani confrontano coppie di risposte e indicano quale preferiscono. Il modello impara a produrre risposte simili a quelle scelte. E le risposte scelte tendono a citare fonti con attributi verificabili — autore, data, affiliazione.
Da questo segue — ed è una deduzione basata sul meccanismo, non un esperimento isolato su questo specifico punto — che i contenuti firmati, datati e con fonti citate hanno un vantaggio strutturale. Non perché il modello “legga” la byline e decida consciamente di premiarla. Ma perché durante migliaia di cicli di ottimizzazione, le risposte che attingevano a fonti con questi attributi venivano valutate meglio. Il pattern si è consolidato.
E non si tratta solo del training. Nei sistemi RAG — quelli che recuperano informazioni dal web in tempo reale prima di rispondere — il contenuto con autore verificabile offre un segnale aggiuntivo al processo di retrieval. Il sistema deve decidere quali passaggi includere nella risposta e quali scartare. Un passaggio con autore identificabile, fonte citata e data visibile è un passaggio con più contesto verificabile. Un passaggio anonimo, senza data e senza fonti, è un passaggio che il sistema non ha modo di valutare — e quando non puoi valutare, la scelta più sicura è non includere.
Cosa significa “autore verificabile” per un sistema AI
Attenzione a non confondere “avere una byline” con “avere un autore verificabile”. Scrivere “di Mario Rossi” in fondo a un articolo è un inizio, ma non è sufficiente. L’authorship verificata, per un modello AI, è la somma di segnali che confermano che quella persona esiste, ha competenze in quel campo e ha una presenza documentabile.
Ne ho parlato in modo approfondito nell’articolo sull’author entity recognition: quando il tuo nome è un’entità riconosciuta — con attributi, relazioni e competenze associate nel Knowledge Graph del modello — ogni contenuto che firmi parte con un vantaggio. Quando il tuo nome è una stringa senza connessioni, la byline non aggiunge quasi niente.
Per rendere l’authorship realmente verificabile servono elementi concreti. Il markup schema Person che collega il nome dell’autore alla sua bio strutturata. Una bio che includa credenziali verificabili e affiliazioni. Un profilo autore consistente tra il sito e le piattaforme esterne — LinkedIn, directory di settore, pubblicazioni. E le fonti citate nel testo, che funzionano come una rete di riferimenti incrociati: se citi fonti autorevoli e quelle fonti sono reali e verificabili, il tuo contenuto entra in un circuito di credibilità che si autorinforza.
Perché i contenuti anonimi pagano un prezzo crescente
Il problema dei contenuti anonimi non è che vengano “penalizzati” da un algoritmo esplicito. È che non forniscono al sistema nessun segnale su cui costruire fiducia. In un contesto dove i modelli devono scegliere tra milioni di fonti, l’assenza di segnali è un filtro negativo di fatto.
Pensa a come funziona dal punto di vista del retrieval. Il sistema recupera dieci passaggi rilevanti per una query. Cinque hanno autore, fonti, data. Cinque sono anonimi, senza riferimenti. A parità di contenuto, quali sceglieresti? Non serve una regola esplicita: la meccanica stessa della selezione favorisce chi fornisce più contesto. E con l’evoluzione dei sistemi verso l’agentic AI — modelli che usano strumenti, verificano fonti, incrociano dati prima di rispondere — la capacità di verificare l’authorship diventa sempre più determinante.
Questo è il trend che vedo accelerare. Non è qualcosa che puoi rimandare. Ogni contenuto chiave del tuo sito che oggi è anonimo e privo di fonti sta accumulando uno svantaggio che diventa più pesante con ogni aggiornamento dei sistemi. L’HTTPS protegge il trasporto del dato. La page experience rende il contenuto fruibile. La crawlability lo rende raggiungibile. Il markup semantico lo rende comprensibile. L’authorship verificata lo rende credibile. Sono livelli che si sommano — e senza l’ultimo, tutti gli altri perdono una parte del loro effetto.
Cosa puoi controllare oggi?
Fai un inventario dei tuoi contenuti principali — quelli che vorresti che l’AI citasse nelle risposte. Per ciascuno verifica: c’è un autore con nome e cognome? C’è una bio dell’autore con credenziali reali? C’è un markup schema Person implementato correttamente? Ci sono fonti citate nel testo? C’è una data di pubblicazione visibile?
Se la risposta a una qualsiasi di queste domande è no, hai trovato il tuo punto di partenza. Non servono grandi investimenti: serve metodo. Ogni contenuto chiave deve avere queste cinque cose. Non perché lo dice una best practice generica, ma perché è così che funziona la meccanica di selezione dei sistemi AI.
Questo è un check iniziale che ti dà un’idea chiara di dove sei. Però misurare quanto questi segnali impattano sul tuo posizionamento specifico nelle risposte AI, capire quali contenuti hanno priorità e costruire un profilo autore che i modelli riconoscano come entità — quello richiede un’analisi che va oltre il controllo a occhio. È il lavoro che faccio ogni giorno con chi vuole smettere di essere invisibile e iniziare a essere la fonte che l’AI cita.