Le regole del digitale stanno cambiando.
O sei visibile o sei fuori. Noi ti aiutiamo a raggiungere i clienti giusti — quando ti stanno cercando.
Contattaci ora →
Tolan e GPT-5.1: l’architettura AI che ricostruisce il contesto conversazionale in tempo reale per interazioni più naturali e personalizzate
L'assistente vocale Tolan, sviluppato da Portola, sta rivoluzionando l'interazione uomo-macchina grazie all'integrazione del nuovo modello GPT-5.1 di OpenAI. Con oltre 200.000 utenti, l'app offre conversazioni incredibilmente naturali grazie a un'architettura che ricostruisce il contesto in tempo reale, riducendo i "vuoti di memoria" del 30% e migliorando la capacità di adattamento dell'intelligenza artificiale.
Tolan e GPT-5.1: la conversazione AI diventa (quasi) umana
C’è una nuova app che sta facendo parlare di sé nel mondo dell’intelligenza artificiale conversazionale. Si chiama Tolan, un assistente vocale che ha superato i 200.000 utenti attivi mensili da quando è stato lanciato a febbraio 2025.
Il suo segreto?
L’integrazione di GPT-5.1, l’ultimo modello di OpenAI che, a detta degli sviluppatori, ha rappresentato un vero e proprio punto di svolta per la fluidità e la naturalezza delle interazioni vocali. Quinten Farmer, CEO di Portola (l’azienda dietro Tolan), ha messo subito le cose in chiaro: “Abbiamo visto l’ascesa di ChatGPT e sapevamo che la voce era la prossima frontiera. Ma la voce è più difficile. Non stai solo rispondendo a un testo, stai sostenendo una conversazione dal vivo, che può cambiare direzione in ogni momento”.
Per affrontare questa sfida, non hanno messo insieme solo tecnici, ma anche animatori premiati e uno scrittore di fantascienza, con l’obiettivo di dare una vera e propria personalità ai loro assistenti.
Ma non è solo una questione di belle parole. La vera rivoluzione, come riportato su openai.com, sta nel come Tolan gestisce la conversazione, un approccio che manda in pensione i metodi usati fino a ieri.
L’architettura che non dimentica (e si adatta in tempo reale)
A differenza di molti sistemi che si limitano a “ricordare” le ultime battute, l’architettura di Tolan ricostruisce da zero l’intero contesto a ogni turno della conversazione. Pensa a una chiacchierata normale: se cambi argomento all’improvviso, il tuo amico ti segue. Molte IA, invece, si perdono.
Tolan, invece, ogni volta che parli, mette insieme un riassunto delle ultime frasi, le caratteristiche della sua personalità , i ricordi recuperati da un database vettoriale e le indicazioni sul tono da usare. Questo gli permette di adattarsi istantaneamente se passi da una domanda sul lavoro a una battuta sul tempo.
Secondo Farmer, il passaggio a GPT-5.1 ha ridotto il tempo di risposta di oltre 0,7 secondi, un’enormità in una conversazione, e ha migliorato la “steerability”, che in parole povere significa che il modello fa quello che gli dici di fare con molta più precisione, seguendo le istruzioni su tono e carattere.
Il sistema di memoria, inoltre, non archivia solo fatti, ma anche “vibrazioni” emotive, usando il modello text-embedding-3-large di OpenAI per poi salvare tutto su Turbopuffer, un database che garantisce ricerche quasi istantanee. E per non affogare nei ricordi inutili, ogni notte un processo automatico fa pulizia, eliminando le informazioni superflue e risolvendo le contraddizioni.
Una tecnologia affascinante, certo.
Ma si traduce in un’esperienza migliore per chi usa l’app?
I numeri sembrano dire di sì, e qui le cose si fanno interessanti.
GPT-5.1: più di un semplice aggiornamento?
L’impatto di queste innovazioni è misurabile. Dopo l’integrazione di GPT-5.1, i “vuoti di memoria” dell’assistente sono calati del 30%, mentre la capacità di trattenere gli utenti da un giorno all’altro è aumentata di oltre il 20%. Un utente ha commentato: “Si ricordano cose di cui abbiamo parlato due giorni fa e le tirano fuori nella conversazione di oggi”.
OpenAI, dal canto suo, descrive GPT-5.1 con toni entusiastici, definendolo “più caldo e conversazionale di default”.
L’azienda sostiene che il modello sia dotato di un “ragionamento adattivo”, che gli permette di essere più veloce su compiti semplici e più tenace su quelli complessi. Persino Balyasny Asset Management ha confermato che, nei loro test, GPT-5.1 ha superato i predecessori girando a una velocità 2-3 volte superiore.
Il prossimo passo per Tolan è l’integrazione multimodale, ovvero un sistema in grado di gestire voce, immagini e contesto contemporaneamente.
La strada sembra tracciata, ma la vera sfida sarà creare agenti che non siano solo più efficienti, ma che capiscano davvero il contesto umano senza diventare semplici specchi delle nostre abitudini.
La tecnologia avanza a passi da gigante, ma la domanda resta: stiamo costruendo assistenti o dipendenze digitali sempre più raffinate?
