Le regole del digitale stanno cambiando.
O sei visibile o sei fuori. Noi ti aiutiamo a raggiungere i clienti giusti — quando ti stanno cercando.
Contattaci ora →
Una promessa di modifiche precise e coerenti che punta a superare i limiti degli strumenti di OpenAI, con un approccio innovativo che ha sorpreso la comunità degli sviluppatori.
Google lancia Gemini 2.5 Flash Image, un modello AI che rivoluziona l'editing di immagini risolvendo i problemi di coerenza dei soggetti. Rivelato come il misterioso 'nano-banana', lo strumento permette modifiche precise, mantenendo intatte le caratteristiche principali. Gratuito per gli utenti Gemini, integra SynthID per la tracciabilità , ponendo nuove sfide etiche e strategiche nel mondo dell'intelligenza artificiale.
Il ‘trucchetto’ di Google: prima ti batto, poi ti dico chi sono
Per settimane, nella comunità di sviluppatori e appassionati di IA, si è parlato di un misterioso modello chiamato ‘nano-banana’. Questo strumento era stato caricato in forma anonima su LMArena, una piattaforma dove gli utenti votano il modello migliore mettendoli a confronto.
In poco tempo, ‘nano-banana’ ha sbaragliato la concorrenza, diventando il modello di editing di immagini più apprezzato al mondo, come descritto da SiliconAngle.
Nessuno sapeva chi ci fosse dietro, ma tutti ne riconoscevano la superiorità . Poi, il colpo di scena: Demis Hassabis, il pezzo grosso di Google DeepMind, ha svelato che quel modello era la loro nuova creatura.
Una mossa da manuale: prima ti dimostro sul campo che sono il migliore, e solo dopo ti rivelo il mio nome.
Una trovata di marketing geniale, certo.
Ma al di là della mossa astuta, cosa sa fare davvero questo nuovo Gemini per meritarsi tutta questa attenzione?
Una coerenza che (finalmente) ha senso
Il vero punto di svolta sta nella cosiddetta coerenza del personaggio. In pratica, ora puoi prendere una foto di una persona (o anche del tuo cane) e chiederle di cambiare abito, acconciatura o sfondo, e il volto e le caratteristiche principali rimarranno riconoscibili. Sembra una cosa da poco, ma è una delle sfide più grandi per le IA generative.
Significa poter creare una serie di immagini con lo stesso soggetto in contesti diversi senza che sembri ogni volta una persona differente.
A questo, come spiega Big G, si aggiungono altre funzionalità che aprono porte interessanti. L’editing multi-step, per esempio, ti permette di lavorare sulla stessa immagine passo dopo passo: parti da una stanza vuota e, un comando dopo l’altro, aggiungi il colore alle pareti, i mobili, i quadri. Non devi più ricominciare da capo ogni volta.
E con il design mixing, puoi “fondere” lo stile di un’immagine con gli oggetti di un’altra, ad esempio applicando la trama dei petali di un fiore a un paio di stivali.
Una tecnologia così potente, però, solleva sempre la stessa domanda:
A che prezzo?
E non parlo solo di soldi.
La strategia dietro l’aggiornamento: non è solo una questione di pixel
Google ha messo subito le cose in chiaro. Per l’utente medio, nell’app Gemini, tutto questo resta gratuito. Per i professionisti e le aziende che vogliono integrare questa tecnologia nei loro sistemi, invece, il costo è di 30 dollari per ogni milione di “token” di output.
Un prezzo che sembra pensato per essere aggressivo e spingere all’adozione su larga scala.
Ma la vera partita si gioca altrove. In un mondo sempre più invaso da immagini generate artificialmente, il tema dell’autenticità diventa un campo minato.
Google afferma di aver integrato la sua tecnologia di watermarking invisibile, SynthID, per tracciare le immagini create con Gemini. Una pezza digitale per rassicurare gli animi e provare a mettere un freno alla disinformazione.
Ma basterà a fermare l’abuso di queste tecnologie, che diventano ogni giorno più realistiche e facili da usare?
Il dubbio resta, e forte.
Questo aggiornamento non è solo un passo avanti tecnologico; è un altro pezzo sulla scacchiera della guerra tra titani, dove ogni nuova funzione serve a legare gli utenti al proprio sistema e a dettare le regole di un gioco che sta cambiando il nostro stesso concetto di realtà .
E in questa corsa, le domande su etica e controllo rischiano di rimanere, come sempre, un passo indietro.