Experimentei a mais recente ferramenta de IA do Google que gera imagens de uma maneira nova e divertida

A ferramenta Whisk AI do Google sendo usada com imagens.
Google

A mais recente ferramenta de IA do Google ajuda a automatizar ainda mais a geração de imagens. A ferramenta se chama Whisk e é baseada no mais recente modelo de geração de imagens Imagen 3 do Google. Em vez de depender apenas de prompts de texto, o Whisk ajuda você a criar as imagens desejadas usando outras imagens como prompt base.

O Whisk está atualmente em fase experimental, mas depois de configurado é bastante fácil de navegar. O Google detalhou em uma postagem de blog apresentando o Whisk que ele se destina à “exploração visual rápida, não a edições perfeitas em pixels”.

A exploração da ferramenta tem um ritmo acelerado, em comparação com outras ferramentas baseadas em texto, que dependem mais dos detalhes e da precisão das palavras para produzir uma imagem.

Uma imagem é criada no gerador de imagens Google Whisk AI. Uma imagem é criada no gerador de imagens Google Whisk AI. Uma imagem é criada no gerador de imagens Google Whisk AI.

Depois de passar pela página de boas-vindas, que lista os detalhes importantes que você deve saber sobre o funcionamento da ferramenta, a página perguntando se você gostaria de se inscrever para receber e-mails e a política de privacidade, você carregará diretamente na página principal do Bata. Vi um prompt com uma pelúcia de dinossauro como estilo de imagem, mas as outras opções são alfinete esmaltado e adesivo. Eu apenas fui com o primeiro.

Em seguida, você será direcionado para fazer upload de uma imagem para o assunto. Carreguei uma fotografia de um smartwatch no meu pulso e rapidamente percebi que isso não iria funcionar. A terceira opção à direita estava em modo de carregamento perpétuo, então tentei novamente, com uma imagem mais caricatural que encontrei no meu disco rígido, e carreguei imediatamente em figuras de pelúcia de três criaturas míticas.

Google Whisk sendo usado com imagens enviadas.
Google

Depois que a imagem foi gerada, pude entrar em uma seção de edição, com uma área de prompt de texto. Simplesmente usando a sugestão sugerida “o personagem está tomando sorvete”, gerei imagens adicionais com as mesmas criaturas segurando casquinhas de sorvete.

Alternativamente, você pode rolar para baixo na seção principal do prompt e selecionar começar do zero. Isso permitirá que você carregue todas as suas próprias imagens ou insira seu próprio texto. Você também pode adicionar texto adicional desde o início para que seus personagens possam realizar uma ação. Se você não sabe quais imagens adicionar ou texto digitar, clique no botão Inspire Me e o Whisk preencherá as imagens.

A ferramenta Google Whisk AI sendo usada com imagens.
Google

A ferramenta também permite acessar a seção Minha Biblioteca, onde você pode visualizar todas as imagens que criou. Nesta seção, você pode ativar ou desativar a biblioteca se preferir não salvar suas criações. Você também pode baixar imagens, excluir imagens individualmente ou excluir dados da biblioteca como um todo. Além disso, você pode selecionar a opção de entrada de prompt em cada imagem para ver todo o prompt de texto da imagem gerada. Existe uma opção de cópia disponível para compartilhamento com outras ferramentas e programas.

Mais tarde, descobri que o Whisk gerou uma imagem misturando as imagens do pelúcia e do smartwatch e salvei-a em Minha Biblioteca. Então, minha recomendação é, caso você tenha algum contratempo com a ferramenta, verifique em sua biblioteca se alguma imagem foi desenvolvida em segundo plano.

A ferramenta Whisk lembra o prompt do Microsoft Designer que permite aos usuários criar Funko Pop! figuras . Como um todo, você pode usar o Microsoft Designer para gerar uma variedade de imagens extravagantes ou realistas. No entanto, o gerador de IA funciona apenas com avisos de texto.

Como dito, o Whisk ainda inclui a oportunidade de adicionar prompts de texto, que o Google observou que estão incluídos devido ao potencial da ferramenta de “errar o alvo”, para que você sempre tenha a opção de preencher os prompts quando necessário.