L’intelligenza artificiale che si espande ulteriormente nella ricerca, assistenti digitali che parlano e vedono rendendo sempre più reale lo scenario del film Her. E’ la visione “multimodale” di Google presentata alla Conferenza degli sviluppatori, con cui la società di Mountain View sfida OpenAI e Apple. “Investiamo nell’intelligenza artificiale da più di dieci anni – dice il Ceo Sundar Pichai – Siamo in piena era Gemini”. Google inserirà sempre di più l’intelligenza artificiale generativa nella ricerca, il suo corebusiness da oltre 25 anni.
L’azienda apre a più utenti (“negli Stati Uniti e in futuro ad altri paesi”) le Overview, dei riepiloghi già testati in maniera ristretta: ad una domanda dell’utente offrono una panoramica di più siti e argomenti per risposte più esaustive. Inoltre, grazie a Gemini si potranno formulare in una volta sola domande più complesse e porre questioni anche usando i video. “Contiamo di portarlo a più di un miliardo di persone entro la fine dell’anno”, dice Liz Reid a capo della ricerca Google. L’evento è una rassegna di come l’IA di Gemini prevederà sempre di più i prodotti della società. Gli ‘AI Agents’, così li chiama l’azienda, sono “sistemi intelligenti che faranno il lavoro per noi sotto la nostra supervisione”. Ed ecco allora Project Astra, un assistente digitale multimodale che elabora cioè testo, voce e immagini in tempo reale mentre interagiamo, capendo anche il contesto. In un video Big G lo fa vedere all’opera su smartphone ma anche su lenti smart, riportando così alla memoria i vecchi Google Glass. Astra è la risposta a Gpt-4o lanciato proprio 24 ore fa da OpenAI e in attesa di vedere come anche Apple cambierà il suo assistente Siri con l’IA.
Grazie a Gemini, viene aggiornato anche Google Foto con la funzione ‘Ask’, chiedi a Foto. Nelle gallerie di immagini che tutti noi abbiamo sui dispositivi si potrà trovare più semplicemente una foto formulando una richiesta a voce, senza dover passare in rassegna manualmente immagini e video. “Le vostre foto e i vostri video non vengono mai utilizzati per la pubblicità. E nessuno esaminerà le vostre conversazioni”, specifica la società. Nel corso della conferenza degli sviluppatori, Google ha lanciato anche Veo, la risposta al generatore di video di OpenAI che si chiama Sora, e Imagen 3 che è la versione più avanzata di generazione di foto attraverso un testo. E inizia a collaborare con alcuni musicisti grazie a Music AI Sandbox, un insieme di strumenti che aiutano a comporre.
Una mossa, grazie anche alla sperimentazione con il musicista vincitore di Grammy Wyclef Jean, per rassicurare il mondo degli artisti riguardo gli effetti dell’intelligenza artificiale sulla creatività. “Vogliamo farlo responsabilmente ascoltando il loro feedback”, afferma il vice presidente Product management Eli Collins. Gemini, inoltre, si espande anche ai luoghi di lavoro. La versione 1.5 Pro, ad esempio, entra nelle mail per un sommario oppure fornisce i momenti clou di una riunione o scrive un riassunto. Arriva anche Gemini 1.5 Flash “più veloce e efficiente”, mentre Gemini Advanced da oggi è disponibile in lingua italiana. Infine, Google annuncia Trillium, la sesta generazione di processori, un acceleratore per il Cloud con l’intelligenza artificiale, “più performante e ad alta efficienza energetica”.