O Gemini do Google poderá em breve trabalhar para você.
O Google está supostamente desenvolvendo uma atualização significativa para seu assistente de IA generativa, Gemini, que poderá transformá-lo de um mero auxiliar conversacional em algo mais próximo de um agente de trabalho da vida real. Em uma recente análise do código beta do aplicativo do Google feita pelo 9to5Google , os desenvolvedores descobriram trechos de código que apontam para um recurso conhecido internamente como "automação de tela". Isso sugere que o Gemini poderá em breve realizar ações diretas em seu nome dentro de certos aplicativos Android, como fazer pedidos ou reservar viagens, sem que o usuário precise interagir manualmente com as telas.
Embora o Gemini já execute tarefas conversacionais como redigir e-mails ou gerar planos de pesquisa, esta atualização parece pronta para permitir que ele interaja literalmente com as interfaces dos aplicativos, tocando em botões e navegando pelas telas para concluir tarefas que você normalmente faria manualmente. Os primeiros indícios da versão beta sugerem que esses recursos serão inicialmente limitados a alguns aplicativos compatíveis e enfatizarão a supervisão do usuário, com o Google alertando que "o Gemini pode cometer erros" e que os usuários continuam responsáveis pelas ações realizadas em seu nome.
Como essa atualização transforma a IA de assistente em agente
O conceito por trás da automação de telas representa um grande passo para dar à IA mais autonomia nos fluxos de trabalho digitais do dia a dia. Em vez de apenas sugerir o que você pode fazer, o Gemini poderá em breve executar essas escolhas diretamente dentro dos aplicativos. Os primeiros trechos de código da versão beta do Google também indicam precauções de privacidade, como aconselhar os usuários a não inserir informações de login ou pagamento em chats com IA e alertar que as capturas de tela podem ser analisadas para aprimorar o recurso. O Google já oferece algumas funcionalidades de agente por meio de sua plataforma Gemini Agent no Workspace e na web, onde a IA pode lidar com fluxos de trabalho complexos e coordenar entre serviços, mas a automação de telas poderá trazer essas capacidades diretamente para smartphones e para o uso diário de aplicativos.
Se esses recursos forem amplamente implementados, isso poderá marcar uma mudança na forma como as pessoas interagem com dispositivos móveis, passando de toques e deslizes manuais para a permissão de ferramentas de IA para agirem em seu nome. Isso pode facilitar as rotinas diárias, mas também levanta questões sobre controle, segurança e supervisão, especialmente quando a automação afeta tarefas sensíveis como reservas ou ordens financeiras.
Segundo informações, o Google está posicionando essas atualizações como opcionais e supervisionadas, permitindo que os usuários interrompam ou substituam o Gemini a qualquer momento. Por enquanto, porém, o recurso de automação de tela permanece em desenvolvimento e ainda não chegou às versões estáveis.
O artigo "O Gemini do Google poderá em breve trabalhar para você" foi publicado originalmente no Digital Trends .

