Este é o único recurso de IA do Google I/O 2024 que mal posso esperar para usar
A palestra principal do I/O 2024 do Google estava repleta de novos recursos de IA que estão chegando para desktops e dispositivos móveis, graças ao Gemini. Haverá novas maneiras de pesquisar no Google por meio de solicitações de vídeo e prompts multimodais, enquanto os smartphones eventualmente obterão superpoderes de IA através da câmera com o Projeto Astra .
Mas há um recurso que realmente me chamou a atenção: pergunte fotos com Gêmeos no Google Fotos.
Primeiro, o que é Gêmeos?
Primeiramente, o que é Gêmeos ? É basicamente a família de modelos de IA do Google, que inclui Gemini Nano, Gemini Pro e Gemini Ultra. Resumindo, é a versão do OpenAI do Google e seus próprios modelos GPT, como ChatGPT .
Gemini pode compreender e gerar texto como outros grandes modelos de linguagem (LLMs), como o GPT da OpenAI. No entanto, o Gemini pode fazer um pouco mais – ele entende, opera e combina outras formas de informação, como imagens, vídeo, áudio e até código.
Para smartphones Android , utiliza Gemini Nano , que opera localmente no próprio aparelho. Graças ao modelo Gemini Nano , recursos existentes como Circle to Search ficarão ainda melhores com a capacidade de ajudar os alunos com trabalhos de física e matemática.
Ele também terá ainda mais consciência do contexto do que está atualmente em sua tela, pois você poderá fazer perguntas ao Gemini sobre um vídeo que está assistindo ou um longo PDF que está navegando, em vez de rolar dezenas de páginas. O Gemini Nano trará até recursos multimodais para o seu smartphone, como consultas de pesquisa com múltiplas solicitações em uma.
Ask Photos with Gemini é um dos muitos novos recursos do Gemini anunciados no I/O 2024 e estará no Google Fotos ainda este ano. Resumindo, você pode pesquisar em sua enorme biblioteca de fotos com uma abordagem mais coloquial em vez de palavras-chave.
Na demonstração do Google I/O, o Google mostrou que você pode simplesmente perguntar: “Qual é a minha placa de carro mesmo?” ou “Quando minha filha aprendeu a nadar?” para trazer fotos que respondam a essas solicitações.
Vai ainda um passo além com pedidos como “Mostre-me como a natação da minha filha progrediu”. Consultas como essa fazem o Gêmeos olhar suas fotos por data e contexto para obter um resultado apropriado.
Enquanto Ask Photos with Gemini era exibido no palco, fiquei animado e mal posso esperar para colocar as mãos nele.
Companheiro de IA dos pais
Sou mãe há pouco mais de dois anos. Mas, nesse período, tirei mais fotos do que nunca porque adoro capturar todos os pequenos momentos da minha filha, seja ela sendo fofa e boba ou aqueles marcos significativos que quero capturar em uma foto ou vídeo. Com um iPhone 15 Pro de 1 TB e os inúmeros telefones Android que testo, estou sempre tirando fotos da minha filha.
Você pode pensar que é um exagero – talvez seja. Mas não tenho muitas fotos, muito menos vídeos, da minha infância dos meus pais. Eles realmente não capturaram todos os meus momentos especiais, e só tenho lembranças vagas, nada super detalhado ou específico. Com toda a tecnologia que temos agora, ajudou-me a garantir que a minha filha terá provas visuais da sua infância.
Embora eu tire fotos e grave vídeos para compartilhar com familiares e amigos selecionados, capturo esses momentos principalmente porque quero relembrá-los mais tarde. Esteja eu apenas procurando um estímulo rápido para trazer um sorriso ao meu rosto ou quando sou uma senhora senil e preciso de um passeio pela estrada da memória, eu repasso bastante minhas memórias visuais.
Com o Ask Photos with Gemini, mal posso esperar para pedir que ele me mostre o progresso da minha filha em vários eventos da vida. Por exemplo, vamos iniciá-la na pré-escola em agosto. Eu adoraria pedir a Gêmeos que me mostrasse seu progresso ao longo da escola ou apenas me mostrasse todos os seus “primeiros dias” de cada ano letivo. Ou quando ela aprende a andar de bicicleta, posso ver seu progresso na transição das rodinhas para uma bicicleta completa. Caramba, Gêmeos poderia até me mostrar quando minha filha apaga as velas de seu bolo de aniversário todos os anos.
Existem tantas possibilidades de utilizar o Ask Photos, mas essas são apenas algumas ideias que me vêm à mente. E embora seja ótimo para os pais nos marcos dos filhos, também é ótimo para outras coisas. Posso me imaginar usando-o em meus aniversários, feriados e até mesmo em meus animais de estimação.
Claro, eu poderia examinar todas as minhas fotos agora e pesquisar rostos e palavras-chave. Mas Ask Photos with Gemini parece uma maneira muito mais simples, rápida e natural de fazer isso. E quando você tem uma biblioteca de fotos com mais de 50.000 fotos e vídeos, bem, eu poderia usar uma maneira mais fácil de pesquisá-la.
Mal posso esperar para usar isso
Ask Photos não é o único recurso Gemini AI que o Google exibiu no Google I/O 2024. E embora seja o que mais me entusiasma por causa de sua praticidade, há outras coisas interessantes que quero conferir também.
Por exemplo, o Projeto Astra parecia intrigante. Costumo usar meu telefone para tirar uma foto de algo que quero salvar para mais tarde e aprender mais, como plantas e flores. Mas com o Astra, você terá a qualidade da IA na câmera e ela pode informar o que você está vendo em tempo real. E embora o Google não tenha anunciado nenhum óculos inteligente , o Projeto Astra mostrou que esse seria um recurso incrível para se ter em óculos inteligentes em algum momento.
Também estou ansioso para verificar as solicitações de prompt multimodais na Pesquisa Google com tecnologia Gemini. Não sou o tipo de pessoa que gosta de planejar nada, então, se o Google puder fazer o trabalho braçal para mim, então sou totalmente a favor. E embora eu não ache que os alertas de golpes em tempo real sejam muito úteis para mim (de qualquer maneira, nunca atendo o telefone), será um recurso muito útil para outras pessoas.
O Ask Photos with Gemini deve chegar ao Google Fotos ainda neste verão, e mal posso esperar para tentar.