Google svela la “tabella” Navboost: una mossa strategica per l’antitrust o la punta dell’iceberg di un sistema più complesso?
Google ha svelato che il suo algoritmo Navboost, cruciale per il ranking, sarebbe una "grande tabella" di dati aggregati di interazione utente (clic, tempo sulla pagina), non un sistema basato prevalentemente su machine learning. La rivelazione è emersa dai documenti del processo antitrust DOJ. La "semplificazione" solleva scetticismo e preoccupazioni per la privacy sotto la lente regolatoria.
Ma allora, cos’è ‘sta Navboost secondo Google? una semplice tabellina?
Stando a Big G, Navboost macina per 13 mesi le metriche di interazione degli utenti – parliamo di clic, impressioni, e i famosi “clic più lunghi”, cioè quanto tempo passiamo effettivamente su una pagina, come riportato da Semrush e spiegato nel dettaglio da Dan Taylor SEO. Questi dati, poi, generano i punteggi IR (Information Retrieval) che, guarda un po’, finiscono per influenzare il ranking.
Quindi, al contrario di quello che molti di noi sospettavano, niente personalizzazione spinta dal machine learning; Google ora ce lo descrive come “più una grande tabella che immagazzina porzioni di dati basate su località e tipo di dispositivo”.
In pratica, una segmentazione dei dati che permette di sfornare risultati su misura per chi naviga da mobile o da desktop, e a seconda della regione geografica, come evidenziato anche da OuterBox Design.
Ma attenzione, perché questa “tabella” non è onnipotente: pare che influenzi il ranking solo dopo che le pagine hanno superato una prima soglia di pertinenza, un dettaglio emerso dalle testimonianze nel processo DOJ e riportato da SE Ranking.
E i dati dei clic? Conservati per 13 mesi – un periodo ridotto rispetto ai 18 mesi pre-2017 – e tiene traccia di oltre 10 metriche di interazione, inclusi i pittoreschi unicornClicks e badClicks emersi dai documenti API trapelati.
Una “semplice tabella”, quindi?
Permettimi di dubitarne.
E se questa è la versione “ufficiale”, cosa si nasconde davvero dietro questa presunta semplicità, soprattutto quando si parla di dati così sensibili?
La “tabella” e il gigante con i piedi d’argilla
Questa “chiarificazione” da parte di Google arriva, guarda caso, in un momento in cui i riflettori normativi sono puntati dritti sulla compagnia, specialmente dopo la condanna per antitrust dell’agosto 2024. Pandu Nayak, il VP of Search di Google, aveva già testimoniato che Navboost lavora a braccetto con il sistema “Glue” – quest’ultimo si occupa di gestire gli elementi della SERP che non sono pagine web, come i knowledge panel.
Una distinzione che, secondo alcuni analisti SEO, serve a Google come scudo contro le accuse di monopolio: in pratica, cercano di far passare Navboost per un semplice specchio delle preferenze degli utenti, e non per il buttafuori attivo che decide chi entra e chi resta fuori dal party dei risultati di ricerca.
Ma c’è chi non ci sta.
Katherine White, Vicedirettrice della FTC, ha recentemente appoggiato le proposte del DOJ che obbligherebbero Google a condividere i dati di ricerca con i concorrenti, affermando senza mezzi termini, come si legge in un comunicato della FTC, che queste misure “potrebbero costringere Google a competere finalmente sulla protezione della privacy dei consumatori”.
E qui casca l’asino, perché Navboost si pappa proprio i dati sensibili del clickstream, una preoccupazione che si ingigantisce se pensiamo ai tre “schiaffetti” (leggi: accordi di consenso) che Google ha già ricevuto dalla FTC dal 2011 per violazioni della privacy. Insomma, la “grande tabella” sembra meno innocua di quanto vogliano farci credere, soprattutto quando le autorità iniziano a chiedere il conto.
Ma gli esperti del settore, quelli che con queste cose ci lavorano tutti i giorni, cosa ne pensano di questa improvvisa “semplicità”?
Voci dal fronte SEO e implicazioni future: una “tabella” che fa discutere (e preoccupare)
Come puoi immaginare, tra noi professionisti SEO c’è un bel po’ di scetticismo riguardo a questa storia della “grande tabella”. Marie Haynes, ad esempio, si chiede con una certa arguzia, come riportato sul suo blog: “Se Navboost si limita a organizzare segnali esistenti, perché ha bisogno di metriche così cervellotiche come *unsquashedLastLongestClicks*?”.
Bella domanda, no?
E Dan Taylor, dal canto suo, sottolinea le implicazioni operative: la riduzione della conservazione dei dati a 13 mesi significa che i siti più “anziani” dovranno sudare sette camicie per mantenere i benefici di ranking storici. Persino da alcuni post trapelati da forum di sviluppatori interni a Google nel 2024, citati da Seroundtable in un altro pezzo, emergono dibattiti sulle sfide computazionali di Navboost, con un ex Googler che avrebbe ammesso come “le difficoltà di scalabilità rendevano gli approcci ML impraticabili per la segmentazione in tempo reale”.
Eppure, Google non ci ha ancora spiegato come questa “grande tabella” si interfacci con sistemi di machine learning confermati come RankBrain.
Un silenzio che puzza un po’, non trovi?
L’evoluzione di Navboost, con il passaggio da 18 a 13 mesi di conservazione dei dati già nel 2017, sembra quasi un funambolismo di Google tra la trasparenza algoritmica (o presunta tale) e il segreto industriale, un gioco che oggi, con la FTC che spinge per la condivisione obbligatoria dei dati, potrebbe costare caro.
E così, Navboost e la sua architettura “semplificata” potrebbero diventare il vero campo di battaglia sia per i sostenitori della neutralità della ricerca sia per i regolatori a caccia di soluzioni tecniche.
Mentre il DOJ si prepara a finalizzare la sua sentenza antitrust, questa riclassificazione di Navboost come “non-ML” potrebbe essere una mossa strategica bella e buona: magari per rendere le sue “tabelle di dati” soggette a licenza obbligatoria, proteggendo al contempo i modelli di machine learning proprietari. Una distinzione sottile, ma che potrebbe ridisegnare le regole del gioco della concorrenza nel mercato della ricerca per i prossimi dieci anni.
Staremo a vedere, ma una cosa è certa: la storia di Navboost è tutt’altro che finita, e questa “grande tabella” potrebbe nascondere più di qualche scheletro nell’armadio.