O novo modelo Gemini 2.0 AI do Google está prestes a estar em toda parte
Menos de um ano após o lançamento do Gemini 1.5 , a divisão DeepMind do Google voltou na quarta-feira para revelar o modelo de próxima geração da IA, o Gemini 2.0. O novo modelo oferece imagem nativa e saída de áudio e “nos permitirá construir novos agentes de IA que nos aproximam de nossa visão de um assistente universal”, escreveu a empresa em seu anúncio no blog .
A partir de quarta-feira, o Gemini 2.0 estará disponível em todos os níveis de assinatura, inclusive gratuito. Como o novo modelo carro-chefe de IA do Google, você pode esperar que ele comece a potencializar os recursos de IA em todo o ecossistema da empresa nos próximos meses. Tal como acontece com o modelo o1 da OpenAI , o lançamento inicial do Gemini 2.0 não é a versão completa da empresa, mas sim uma iteração de “visualização experimental” menor e menos capaz que será atualizada no Google Gemini nos próximos meses.
“Efetivamente”, disse o CEO do Google DeepMind, Demis Hassabis, ao The Verge , “é tão bom quanto o modelo Pro atual. Portanto, você pode pensar nisso como uma camada melhor, com a mesma eficiência de custo, eficiência de desempenho e velocidade. Estamos muito felizes com isso.”
O Google também está lançando uma versão leve do modelo, batizada de Gemini 2.0 Flash, para desenvolvedores.
Com o lançamento de um modelo Gemini mais capaz, o Google avança sua agenda de agentes de IA, que veria modelos menores e desenvolvidos especificamente para agir de forma autônoma em nome do usuário. Espera-se que o Gemini 2.o impulsione significativamente os esforços do Google para lançar seu Projeto Astra , que combina as habilidades de conversação do Gemini Live com vídeo em tempo real e análise de imagem para fornecer aos usuários informações sobre o ambiente ao seu redor por meio de uma interface de óculos inteligentes.
O Google também anunciou na quarta-feira o lançamento do Project Mariner , a resposta da empresa ao recurso Computer Control da Anthropic . Esta extensão do Chrome é capaz de comandar um computador desktop, incluindo pressionamentos de teclas e cliques do mouse, da mesma forma que os usuários humanos fazem. A empresa também está lançando um assistente de codificação de IA chamado Jules, que pode ajudar os desenvolvedores a encontrar e melhorar códigos desajeitados, bem como um recurso de “Pesquisa Profunda” que pode gerar relatórios detalhados sobre os assuntos que você pesquisa na Internet.
Deep Research, que parece ter a mesma função que Perplextiy AI e ChatGPT Search, está atualmente disponível para assinantes Gemini Advanced de língua inglesa. O sistema funciona gerando primeiro um “plano de pesquisa em várias etapas”, que é submetido ao usuário para aprovação antes da implementação.
Depois de assinar o plano, o agente de pesquisa realizará uma pesquisa sobre o assunto em questão e, em seguida, descerá em qualquer toca de coelho relevante que encontrar. Assim que terminar a pesquisa, a IA irá regurgitar um relatório sobre o que foi encontrado, incluindo as principais descobertas e links de citação para onde encontrou suas informações. Você pode selecioná-lo no menu suspenso de seleção de modelo do chatbot, na parte superior da página inicial do Gemini.