Ho testato la nuova funzione di automazione delle attività di Gemini su Pixel 10 Pro e Galaxy S26 Ultra. Per la prima volta Gemini prende il controllo e usa le app per te. Al momento funziona solo con poche app di consegna cibo e servizi di rideshare ed è ancora in beta. Risultato netto: è lenta, a volte impacciata, non risolve problemi urgenti, ma è sorprendentemente avanzata.
Come funziona, in pratica
La funzione permette a Gemini di aprire app, scorrere menu e selezionare opzioni come se fosse una persona. Di solito lavora in background: questo significa che può continuare a operare mentre usi il telefono per altro oppure mentre non lo guardi. Se vuoi osservare ogni passo, però, puoi aprire una finestra che mostra testi in basso allo schermo con le azioni che Gemini sta compiendo, per esempio: "Selezione seconda porzione di Chicken Teriyaki per il menu".
Perché è lento
Gemini è più lento di una persona a usare il telefono. Se devi ordinare un Uber subito, è meglio farlo da solo. La lentezza non è un bug completo: l'idea è che l'automazione lavori mentre tu fai altro. Tuttavia, alcune operazioni diventano estenuanti da guardare. In un caso Gemini ha impiegato circa nove minuti per assemblare un ordine di teriyaki, sbagliando qualche volta e correggendosi da sola.
Esempi concreti
- Ordine al ristorante: ho chiesto un "combo" di pollo e Gemini ha capito che il menu offriva mezze porzioni. Ha sommato due mezze porzioni per ottenere una porzione intera. Funziona, ma non senza tentennamenti. In un punto non trovava un contorno che era invece ben visibile in alto nello schermo.
- Prenotazione per un volo: ho inserito un evento di viaggio sul calendario e ho chiesto a Gemini di prenotare un Uber per arrivare in aeroporto in tempo. Perché Gemini ha accesso a email e calendario ha potuto cercare i dettagli del volo. Dopo un piccolo aiuto nel trovare la prenotazione, ha suggerito orari plausibili e in circa tre minuti ha impostato la prenotazione senza ulteriore intervento.
Affidabilità e limiti attuali
Gemini completa i passaggi fino al momento della conferma finale: spetta a te premere il pulsante per ordinare o prenotare. Questa è una scelta sensata per evitare ordini non voluti. Nelle mie prove non ha mai concluso un ordine da sola senza chiedere conferma, e i risultati finali sono stati in genere corretti. Quando fallisce, succede quasi sempre nei primi minuti, per problemi come autorizzazioni all'uso della posizione o impostazioni di consegna errate. Una volta risolto il problema, si può riavviare l'automazione senza troppe difficoltà.
Perché è impressionante
La cosa più notevole è che questa è la prima volta che vedo un assistente AI usare app reali su uno smartphone, non in demo controllate. Usare il linguaggio naturale per dire al dispositivo cosa fare cambia le cose: non serve conoscere etichette esatte dei menu, il sistema prova a interpretare la tua richiesta e a risolvere. Quando funziona, è davvero comodo.
Cosa serve perché funzioni meglio
Il metodo usato da Gemini oggi ragiona attraverso interfacce pensate per gli esseri umani. Questo è fragile: app con banner pubblicitari, foto ammiccanti e strutture di menu varie confondono l'AI. Se le app dessero dati strutturati, non pagine pensate per essere scorse da una persona, un assistente come Gemini sarebbe molto più affidabile e veloce. Esistono già approcci del genere che l'industria sta sviluppando, e Android dispone di alternative tecniche.
- Pro: accesso a calendario e email, abilità nel ragionare su opzioni non esplicite, uso del linguaggio naturale.
- Contro: lentezza, occasionali errori d'interpretazione, dipendenza da interfacce pensate per umani invece che per macchine.
Conclusione
Questa versione di automazione di Gemini è goffa e non pronta a sostituire l'utente umano in tutte le situazioni. Allo stesso tempo, mostra chiaramente una direzione nuova per gli assistenti mobile: non più solo rispondere a comandi vocali semplici, ma agire dentro le app per conto tuo. È un primo passo importante: scomodo oggi, ma promettente per il futuro.
Fotografie originali rimosse nella versione pubblicata.