Google potrebbe essere sul punto di lanciare un agente AI in grado di controllare un browser web per aiutare gli utenti ad automatizzare le attività quotidiane. The Information riferisce che l'azienda sta lavorando a un "agente che utilizza il computer" con il nome in codice di Project Jarvis, che potrebbe essere presentato già a dicembre. Fonti che hanno parlato con The Information riferiscono che Jarvis risponde ai comandi di una persona scattando frequentemente schermate di ciò che è presente sullo schermo del computer e interpretando tali catture prima di eseguire azioni come fare clic su un pulsante o digitare in un campo di testo.
Secondo quanto riferito, Jarvis funzionerà solo con i browser web, in particolare Chrome, per aiutare a svolgere attività comuni come la ricerca, lo shopping e la prenotazione di voli. Questo avviene mentre Google sta espandendo le capacità della sua AI Gemini, la cui prossima generazione sarà presentata a dicembre, come riporta The Verge. Gemini Live, il chatbot AI di Google, è stato ampliato questo mese per includere decine di nuove lingue e l'integrazione di Gemini è stata recentemente aggiunta a Google Meet, Photos e altre applicazioni.
L'annuncio di Jarvis arriva pochi giorni dopo che Anthropic ha presentato una funzione simile, ma apparentemente più completa, per la sua Claude AI, che sostiene di essere stata dotata di competenze informatiche che le consentono di "utilizzare una serie di strumenti standard e programmi software progettati per gli esseri umani". Questa funzione è ora disponibile in una versione beta pubblica.