Google BERT (spiegato facile)

Google bert update italia aggiornamento algoritmo Google

Se c’è una cosa che ho imparato in 15 anni di lavoro su Google Search, è che la curiosità delle persone è infinita. Vediamo miliardi di ricerche ogni giorno, e il 15 per cento di quelle domande sono quelle che non abbiamo mai visto prima – ecco perché abbiamo costruito sistemi per restituire i risultati per tutte quelle query che non possiamo anticipare.

Pandu Nayak
Google Fellow and Vice President, Search

Cosa è il Google Bert update

Come avrai letto dal cappello introduttivo a parlare è un esperto seo di non poco conto. Ma partiamo dalla base: BERT, acronimo che sta per Bidirectional Encoder Representations from Transformers è un update basato sull’utilizzo di reti neurali utili per una migliore elaborazione del linguaggio umano naturale e proprio in questo senso si pone come obiettivo, riuscendoci, di comprendere meglio il contesto completo delle query e dei testi di risposta forniti dal motore di ricerca con soglie di comprensione “sfidanti” ancora più definite, precise e attente.

Ho sentito tanti in questi giorni parlare di questo update, l’update che è stato rilasciato ufficialmente il 9 Dicembre anche in Italia.

C’è molta pubblicità e disinformazione su BERT, il nuovo aggiornamento dell’algoritmo di Google. Ecco perché ho pensato di scrivere questo articolo che si pone come obiettivo di spiegarti che cosa è effettivamente BERT, come funziona e perché è importante per la SEO.

Fondamentalmente, BERT è l’ultimo tentativo di Google di abbinare il significato delle query di ricerca ai risultati più rilevanti. Per funzionare, questo update, utilizza una tecnica chiamata Natural Language Processing che sfrutta l’intelligenza artificiale per comprendere cosa cercano le persone e come/quanto i contenuti corrispondano effettivamente alle loro esigenze. Google BERT che da ora si addiziona dunque ai tanti algoritmi utilizzati  da Google, aiuterà il motore di ricerca a comprendere cosa significano le parole in una frase, ma – novità assoluta – permettendogli questa volta di comprenderne tutte le sfumature nel contesto semantico.

Come puoi immaginare un passaggio di questo tipo non può che portare a significativi cambiamenti nel funzionamento di Google. Piccoli modificatori in query come “non”, “a” o “no” possono essere stati infatti precedentemente “mal compresi” dagli algoritmi di Google, che sino a poco fa adottavano un approccio ad ampio raggio.

Cerco di fartela facile facile.

Se ad esempio, prima di BERT, avessi voluto includere la parola “consulente seo” in un testo che parla dei panda, un ottimo escamotage sarebbe stato proprio quello di farlo utilizzando una negazione, come ad esempio: …certamente un panda non si comporterà come un consulente seo!

Questo era possibile -e funzionava – perché Google non riusciva ad elaborare e comprendere a fondo l’argomento, si limitava ad esplorarne le singole parole ignorandone però il contesto.

Presto detto, BERT lavora esattamente su questo ed altri aspetti e da oggi le query – e con esse le varie analisi keyword –  saranno valutate in modo molto più dettagliato, prendendo in considerazione sfumature che potrebbero essere state ignorate in precedenza. Sfumature di cui dovrai necessariamente tenere conto quando avvierai la tua prossima keyword research.

Ci tengo a sottolineare che BERT non sostituisce RankBrain, al contrario ci lavora in parallelo. Si tratta infatti di n componente aggiuntivo che può essere utilizzato a discrezione del motore di ricerca per alcune domande, la dove le sue “capacità” possano risultare più utili, e a quanto pare ha un sacco di lavoro da fare. Al momento, Google afferma infatti che interessi ben il 10% delle ricerche fatte sul campione USA – che come capirai è una quantità enorme di roba.

Ma come funziona esattamente Google BERT?

BERT rappresenta uno degli sviluppi più innovativi nel campo della NLP. Nel caso non sapessi di cosa si tratti, NLP sta per Natural Language Processing ed è un campo dell’Intelligenza Artificiale che dà alle macchine la capacità di leggere, comprendere e trarre significato dai linguaggi umani.

Si, proprio come in blade runner.

Ma torniamo a BERT per un secondo.

I modelli precedenti a questo update, definiti di fatto “tradizionali” – mi vengono in mente word2vec o GloVe – lavoravano su singole parole, il che significa che ad esempio la parola “credenza” avrebbe goduto della stessa comprensione in frasi come “bella la credenza…” riferita ad un mobile e “la credenza popolare…” riferita appunto ad una convinzione diffusa.

BERT risolve questa faccenda con non poca astuzia grazie principalmente all’applicazione di due differenti modelli di pre-allenamento neurale.

Il primo modello si chiama – Mask Language Model (MLM) – e serve a predire alcune parole e auto-verificare che abbia effettivamente capito di cosa si stia parlando.

Il sistema è semplice ma dannatamente efficace, praticamente cerca di auto-fregarsi, nascondendosi da solo alcune parole. Poi prova ad indovinarle e se riesce ad azzeccarle si da una pacca sulla spalla e passa alla fase successiva.

Prima di inserire le sequenze di parole il 15% delle parole di ogni sequenza vengono sostituite da un cosiddetto “token mascherato”. Il modello tenta quindi di prevedere il valore originale delle parole mascherate, sulla base del contesto fornito dalle altre parole non in chiaro nella sequenza.

La seconda tecnica è chiamata Next Sentence Prediction (NSP) e serve a BERT per relazionare tra loro le frasi. Nel processo di formazione, il modello riceve coppie di frasi come input e impara a prevedere se la seconda frase della coppia è la frase successiva nel documento originale. Prendiamo ad esempio due frasi X e Y, la seconda, Y è la frase successiva ad A nel corpus, o solo una frase casuale? Ecco, capisce anche questo 😀

Google BERT & SEO

Se sei arrivato sino a questo punto mi aspetto che tu ti stia domandando in che modo Google BERT possa influire sul posizionamento del tuo sito e più in generale in termini SEO.

Dovunque leggerai che “nulla cambia, vai tranquillo e fregatene”, ecco, io non la penso esattamente così. Ci sono infatti degli aspetti che se lavorati, possono certamente permetterti di avvantaggiarti e alcuni avvertimenti che faresti bene a metterti in testa. Indirettamente tieni presente che un update di questo tipo influisce non solo sul tuo sito ma anche su un eventuale servizio di link building o di digital pr attivi su siti esterni. La qualità sarà valutata non solo su di te ma anche intorno a te.

Queste dunque le mie raccomandazioni.

  • Probabilmente perderai il traffico se non hai definito bene il contesto.
    In primis se facevi traffico da chiavi “non perfettamente in contesto” mettiti in testa che hai grandi possibilità di perderlo e questo accadrà perché Google BERT permette al motore di ricerca di comprendere il contesto di una query, quindi, faresti bene a dare maggior rilevanza al contenuto nelle tue pagine.
  • Le long tails diventano sempre più importanti.
    Oramai non ci sono più scuse e non hai più tempo, devi lavorare per le ricerche vocali, le query introdotte su google e quelle dettate a voce sono molto diverse, ecco perché grazie ad un uso corretto delle long tails potresti addirittura ricevere tanto nuovo traffico.
  • Google tenderà a mettere sempre più da parte le pagine scarse.
    Google non sarà capace di estrarre le informazioni dal tuo sito se questo non ospita contenuti completi, rilevanti e densi di informazioni utili ai tuoi utenti. Se dunque non hai tra le mani un piano editoriale degno di tale nome e se ad oggi hai fatto content marketing con gli articoletti “fatti per Google“… adios, quella è la finestra.
  • I dati strutturati sono il presente ed il futuro.
    Se ancora non ti fosse chiaro, devi utilizzare un sistema di marcatura del contenuto capace di dialogare correttamente con il motore di ricerca. Solo in questo modo puoi garantirti di godere dell’intera rete di distribuzione dei contenuti offerta da Google.
  • Devi creare (come minimo) il miglior contenuto possibile sul web.
    • Concentrati sulla scrittura di contenuti migliori per i tuoi utenti.
    • Concentrati sulla migliore risposta possibile ad un intento di ricerca preciso.
    • Concentrati sulla creazione di esperienze incredibili per il tuo pubblico (come minimo).

Ma BERT viene utilizzato solo da Google? Naaaaaa…

Possiamo dire infatti che anche Mark Zuckerberg si sta dando da fare. Sviluppato da Facebook, “RoBERTa” – nome vero, mica male – si basa sulla strategia di mascheramento del linguaggio introdotta da BERT e ne modifica alcuni parametri, come non bastasse questo sistema è stato anche addestrato su una base dati maggiore rispetto a BERT e per un periodo di tempo più lungo. Se dunque pensavi che su Facebook non cambiasse nulla, è arrivato il momento di capire che internet si sta evolvendo.

In conclusione

Con l’aumento della ricerca assistita dall’IA, alcuni hanno sostenuto che gli umani saranno presto sostituiti da alternative robotiche o comunque generate dal computer. La verità è che uno degli utilizzi primari dell’intelligenza artificiale è proprio quello di eliminare la spazzatura e aiutare persone e computer ad identificare i migliori contenuti e le migliori risposte alle loro domande.

BERT è progettato per funzionare intorno all’essere umano e alla sua naturale esposizione delle parole nel linguaggio comune e a mio avviso sembra improbabile che i testi robotici o artificiali possano arrivare a dare risultati utili, coinvolgenti e ben scritti come quello che stai leggendo ora 😀

Mentre dunque, per ora le macchine ancora non ci rubano il lavoro dovrai concentrarti a fare principalmente una cosa, creare, questa volta per davvero, contenuti che siano come minimo memorabili!

Fai marketing ascoltando, non strillando.
Un abbraccio.


Commenta questo post