Le regole del digitale stanno cambiando.
O sei visibile o sei fuori. Noi ti aiutiamo a raggiungere i clienti giusti — quando ti stanno cercando.
Contattaci ora →
Si tratta del primo modello di Google in grado di comprendere e mettere in relazione dati di natura completamente diversa, dai testi alle immagini, ai video, all’audio e persino ai documenti, trasformando tutto in un unico linguaggio matematico.
Google ha rilasciato Gemini Embedding 2, un potente modello IA multimodale che unifica testi, immagini e video. La promessa è di rivoluzionare la ricerca semantica e la RAG. Tuttavia, l'integrazione stretta con la sua piattaforma Vertex AI solleva interrogativi: è un reale progresso per tutti o una mossa per rafforzare la dipendenza dall'ecosistema di Big G?
Gemini embedding 2 è realtà: Google ci promette un’IA che capisce tutto
Google ha premuto il grande bottone rosso: dal 22 aprile, come riportato nel suo changelog ufficiale, Gemini embedding 2 è uscito dalla fase di anteprima ed è disponibile per tutti.
Di cosa stiamo parlando?
In parole povere, del primo modello di Google capace, a detta loro, di capire e mettere in relazione dati di natura completamente diversa: testi, immagini, video, audio e persino documenti. Non più sistemi separati che analizzano un pezzo alla volta, ma un unico “cervello” che processa tutto insieme.
La promessa è di quelle che fanno girare la testa: un’intelligenza artificiale che non si limita a leggere una descrizione o a riconoscere un oggetto in una foto, ma che capisce il legame profondo tra l’immagine di un paio di scarpe da corsa, la recensione di un utente che ne parla e il video di un atleta che le usa. Tutto viene trasformato in un unico linguaggio matematico, un singolo spazio vettoriale.
Sulla carta, è una svolta pazzesca.
Ma passiamo dalla teoria alla pratica: cosa te ne fai, tu, domani mattina, di un modello che capisce un video come se fosse un testo?
Dalla teoria alla pratica: cosa ci puoi fare davvero?
L’idea di Google è quella di dare una bella spallata a sistemi come la ricerca semantica e, soprattutto, la RAG (Retrieval-Augmented Generation), quella tecnologia che permette alle IA di pescare informazioni precise da una base di conoscenza per dare risposte più accurate.
Pensa al tuo e-commerce: un cliente potrebbe caricare la foto di una giacca vista su una rivista e il tuo sito non solo la troverebbe, ma proporrebbe anche i pantaloni abbinati che ha visto in un video tutorial.
Oppure, potresti chiedere al tuo archivio video: “mostrami tutte le scene in cui il protagonista sembra preoccupato” e il sistema te le troverebbe analizzando espressioni e contesto, senza bisogno di tag manuali.
Durante la fase di anteprima, Google afferma che gli sviluppatori hanno creato “motori di scoperta avanzati per l’e-commerce e strumenti efficienti di analisi video”. Sembra tutto fantastico, ma la domanda sorge spontanea: quanti di questi esperimenti diventeranno prodotti solidi e profittevoli per aziende che non hanno le risorse di una multinazionale?
La promessa è quella di semplificare un lavoro che prima richiedeva un’orchestra di sistemi diversi.
Ma ogni semplificazione, si sa, ha un suo costo nascosto.
E qui, il costo potrebbe essere legato a una crescente dipendenza.
La potenza ha un costo (e non solo in dollari)
Analizziamo i fatti.
Questo nuovo gioiellino è accessibile tramite la Gemini API e Vertex AI, la piattaforma cloud di Google. Una mossa che, per chi è abituato a leggere tra le righe, suona come un invito nemmeno troppo velato a entrare e accomodarsi nel loro mondo.
Una volta dentro, uscirne è sempre più complicato.
Tecnicamente, il modello genera vettori a 3.072 dimensioni, un numero che indica una grande “profondità” di comprensione. Ma vettori così grandi, come descritto nella documentazione tecnica, significano anche costi di archiviazione e calcolo più alti.
Google, furbamente, offre una soluzione chiamata Matryoshka Representation Learning (MRL) per “scalare” questi vettori e ridurne le dimensioni, ma il dubbio resta: questa flessibilità è un vero vantaggio per tutti o una leva per ottimizzare le performance solo all’interno dell’infrastruttura di Big G?
La tecnologia è senza dubbio potente, ma la vera partita non si gioca solo sulla potenza, ma anche sull’accessibilità, sui costi reali e sul controllo che le aziende mantengono sui propri dati e processi.
La domanda finale, quindi, non è “cosa può fare Gemini Embedding 2?”, ma “a chi serve davvero questa nuova, incredibile potenza?”.

Tutto questo allarmismo per un nuovo catalogo universale mi suona come lamentarsi della rilegatura di un libro, ignorandone il contenuto. Finché mi lasciano girare le pagine che voglio io, non vedo il problema; o la copertina è più rigida di quanto sembri?
Raffaele Graziani, non temo la copertina rigida. Mi chiedo cosa succederà quando il libro inizierà a sottolineare le parole che preferisce lui.
Ci vendono una conoscenza universale, ma l’unico prezzo che non menzionano è la nostra anima aziendale. E tutti in fila per pagarlo, che tenerezza.
Paola Caprioli, non è un prezzo, è un abbonamento perpetuo al grande Leviatano digitale. La tenerezza sta nel credere di avere ancora un’anima da vendere, quando in realtà l’abbiamo già data in leasing da tempo.
Emanuela, altro che leasing. Siamo i mattoni consenzienti del loro nuovo mondo, non i clienti.
Ci costruiscono un ponte verso la conoscenza unificata, ma l’unica destinazione è la loro piattaforma. La libertà di scelta è solo un’illusione ben disegnata?
Benedetta, la chiamano conoscenza unificata; io la chiamo un’elegante prigionia con vista panoramica.
Che fico, un’IA che mette insieme i cocci sparsi del nostro sapere digitale, ma mi chiedo se per usarla dovrò vendere un rene o direttamente l’anima a Big G. Bel dilemma, comunque.
Silvia Graziani, il rene è il meno. Ci regalano le chiavi di un universo meraviglioso, dimenticando di dirci che la porta d’uscita non esiste. E noi, eterni sognatori, applaudiamo pure. Che ingenuità la nostra.
Ci propongono un cervello onnisciente, dimenticando di menzionare che l’abbonamento include la cessione del nostro. Come imprenditore dovrei accoglierlo, eppure avverto solo il rumore di una gabbia che si chiude con meticolosa lentezza.
Celebriamo un’intelligenza capace di unificare ogni tipo di dato, mentre la sua esistenza serve a unificare gli utenti sotto un unico, comodo, padrone. Una simmetria quasi poetica.
Altro guinzaglio dorato da Big G. Promettono il cielo, ma solo dentro la loro gabbia. Davvero qualcuno si aspettava della beneficenza?
@Giada Mariani La beneficenza è un’idea romantica; oggi si concede la conoscenza universale a patto di abitare nel giardino recintato del benefattore. Chissà dove finisce l’aiuto e dove inizia il controllo.