O Nano Banana 2 acaba de ser lançado! É acessível e vem em grande quantidade; depois de experimentá-lo, descobri estes detalhes.

Ao usar IA para gerar imagens, surge sempre um dilema: velocidade ou qualidade?
No entanto, velocidade e qualidade não são necessariamente mutuamente exclusivas. Acaba de lançar oficialmente seu modelo de geração de imagens de última geração: Nano Banana 2 (Gemini 3.1 Flash Image).

Sem grandes slogans revolucionários, a IA simplesmente incorporou melhor qualidade de imagem e uma compreensão mais humana em uma arquitetura subjacente completamente nova. Esse único fator faz com que as imagens geradas por IA pareçam menos uma questão de sorte e mais confiáveis e fáceis de usar.

▲Endereço oficial do blog: https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/
Com acesso a toda a internet, essa IA realmente entende o que você está dizendo.
Para explicar essa mudança, precisamos lembrar o quão difícil era usar imagens geradas por IA há três anos.
Se você pedir para desenhar "carne de porco assada", ela poderá obedientemente desenhar um pedaço de carne queimando; mas se você pedir para escrever uma frase em chinês em um cartaz, ela frequentemente produzirá um monte de rabiscos sem sentido. Essa falta de senso comum sobre o mundo real é o aspecto mais frustrante da IA de primeira geração.
O Nano Banana 2 atual mudou bastante. Assim como seu antecessor, o Nano Banana Pro, ele acessa a vasta base de conhecimento do mundo real da Gemini e pode combiná-la com informações em tempo real de buscas na web, dando a impressão de ser uma pessoa experiente e com bom senso.
A primeira mudança que notou foi que começou a entender melhor o espaço e a proporção.

▲Dica: Na imagem, a Torre de Rádio e TV Pérola Oriental é dominada por um gato supergigante e superfofo. Os prédios ao redor parecem miniaturas, enquanto o gato é enorme. O jogo se passa em um ambiente urbano realista. A atmosfera geral é tranquila, aconchegante, relaxante e adorável.
No caso acima, a IA recriou com precisão os pontos turísticos de Xangai e lidou com as relações de luz, sombra e perspectiva entre o gato gigante e a cidade em miniatura de forma extremamente natural.
A mudança mais notável é que finalmente aprendeu a reconhecer e escrever caracteres. Por exemplo, quando solicitado a pintar um quadro tradicional chinês a tinta da obra "Atracação na Ponte do Bordo à Noite", não só escreveu com capricho todo o poema "A lua se põe, os corvos gritam, a geada cobre o céu" em caligrafia na parte superior da tela, como também captou muito bem o layout e a concepção artística da pintura a tinta.

▲Claro que não está isento de falhas; se você olhar atentamente, verá um caractere "completo" extra no topo.
Além de suas qualidades poéticas, também consegue lidar com cenários de interface de usuário bastante complexos — na imagem abaixo, o painel de dados semitransparente complexo, a lista de compras flutuante e a exibição precisa em chinês são todos organizados de forma ordenada pela IA, e a relação hierárquica entre as informações é verdadeiramente esclarecida.

▲Chamada para ação: Perspectiva em primeira pessoa, situada em um corredor de supermercado bem iluminado. Uma pessoa segura uma garrafa de refrigerante Fanta em frente à câmera. A vibrante bebida laranja está contida em sua icônica garrafa, cercada por uma interface holográfica de realidade aumentada com múltiplas camadas, exibindo dados nutricionais em chinês, incluindo contagem de calorias, teor de açúcar, nível de cafeína, indicador de frescor, data de validade e receitas de bebidas refrescantes e opções de coquetéis recomendadas com base na marca Fanta. O painel da interface do usuário tem um acabamento semelhante a vidro, iluminação ambiente suave, luz e sombras realistas, profundidade de campo natural e uma interface interativa imersiva em primeira pessoa com resolução 2K.
O layout das histórias em quadrinhos japonesas em preto e branco de página dupla é extremamente meticuloso, e é muito fácil de fazer.

▲Desafio: Crie uma ilustração realista de página dupla para uma revista de mangá. Cada página deve conter vários painéis no estilo mangá, dispostos em um layout dinâmico, apresentando a qualidade de um mangá japonês impresso profissionalmente. O estilo geral deve ser em preto e branco, com traços de tinta fortes e marcantes, retículas e desenhos de personagens expressivos. Incorpore balões de diálogo e onomatopeias chinesas, e transmita ação, emoção e ritmo por meio de transições entre os painéis. As páginas esquerda e direita devem fluir perfeitamente juntas, parecendo fazer parte da mesma cena ou capítulo. Empregue técnicas tradicionais de câmera de mangá: closes, planos gerais, painéis angulados e perspectivas e composições dramáticas. A sensação geral deve ser realista e crível, como se fosse uma página dupla de uma revista de mangá autêntica.
Alternativamente, este infográfico chinês sobre "Chá Kung Fu", com instruções passo a passo, oferece uma solução visual que pode ser usada diretamente, desde o layout até a concepção artística.

▲Prompt: Um infográfico vertical lindamente desenhado sobre a cerimônia tradicional chinesa do chá Kung Fu. O fundo é uma pintura tradicional chinesa a tinta. No topo, um título grande e elegante em caligrafia chinesa declara claramente "Chá Kung Fu". Abaixo, três etapas ilustradas: a Etapa 1 mostra o aquecimento da xícara de chá com água fervente, acompanhada da frase chinesa "温杯" (aquecendo a xícara); a Etapa 2 mostra a adição de folhas de chá ao gaiwan (tigela com tampa), acompanhada da frase chinesa "投茶" (adicionando o chá); a Etapa 3 mostra o ato de servir o chá, acompanhada da frase chinesa "出汤" (servindo o chá). O layout apresenta tons terrosos elegantes, minimalistas e aconchegantes, além de um design equilibrado.
Um dos primeiros usuários beta do Nano Banana 2 fez uma avaliação bastante objetiva: "Não é perfeito, mas é o primeiro modelo capaz de lidar com imagens e gráficos realmente complexos com um certo grau de consistência."

Para testar os limites da compreensão desse novo modelo, ele lançou casualmente uma pergunta extremamente capciosa: "Desenhe para mim uma imagem de 'Onde está Wally?', ambientada na Veneza antiga, mas o objeto que você está procurando não pode ser uma pessoa; tem que ser uma lontra vestindo um macacão de voo listrado azul."
Nano Banana 2 finalmente entendeu a lógica, não apenas evitando erros no desenho, mas também apresentando uma resposta sólida.
Vamos nos reconciliar rapidamente, para não termos mais que escolher entre uma coisa e outra?
Além de sua compreensão do senso comum, a poderosa "consistência temática" é outro grande diferencial desta atualização do Nano Banana 2.
Durante um único processo de geração, ele pode manter as características faciais de até 5 personagens ou a aparência de 14 objetos. Isso significa que você pode usá-lo com confiança para desenhar histórias em quadrinhos ou criar storyboards para filmes.

Além disso, a qualidade da imagem é suficientemente alta para ser usada diretamente no trabalho.
É capaz de lidar com tudo, desde imagens de 512px até pôsteres em ultra-alta definição 4K. Digite um comando como "hot pot de Chongqing" e ele gerará uma cena de rua noturna chuvosa em estilo cyberpunk, com detalhes meticulosos no asfalto molhado, os reflexos das luzes de néon vermelhas e azuis e a placa "Aberto 24 horas".

▲Título: Uma fotografia de rua cinematográfica de uma movimentada cidade asiática numa noite chuvosa. Um enorme letreiro de néon vermelho brilhante está pendurado num prédio antigo, exibindo claramente "Chongqing Hot Pot". Abaixo, um letreiro de néon azul menor diz "Aberto 24 horas – Bem-vindo". O asfalto molhado reflete as luzes de néon.
Também consegue reproduzir o estilo Pop Art com sua forte intensidade de cores.

Ou talvez este tipo de editorial de moda, que possui um toque de absurdo, mas exala um ar sofisticado:

▲Dica: Esta fotografia aérea de alta resolução foi tirada com uma LOMO Ic-a. O chão está coberto por inúmeros outdoors em preto e branco com belas modelos, e em cima dos outdoors está uma atriz de cinema chinesa incrivelmente bela vestindo um longo casaco preto.
Neste estudo de caso, filmado de cima, a IA simulou com maestria a textura única de uma câmera LOMO antiga. A atriz está sozinha em um chão coberto de pôsteres em preto e branco, criando uma poderosa tensão cinematográfica e um forte senso narrativo.
No entanto, não está isento de falhas óbvias. Quando personagens de anime, esboços a lápis e Nendoroids são colocados na mesma cena real de uma cafeteria, a integração dos personagens desenhados à mão parece muito forçada, e a transição nas bordas não é suficientemente natural.
Claramente, em termos de fusão interdimensional, é muito menos natural do que a geração anterior de modelos, e ainda há espaço para melhorias.

▲Palavra-chave: Uma foto de uma cena cotidiana em um café movimentado servindo café da manhã. Em primeiro plano, um homem de anime com cabelo azul; uma das pessoas é um desenho a lápis; outra é uma figura de animação em massinha.
Na verdade, apesar dos elogios efusivos do blog oficial ao Nano Banana 2 (Gemini 3.1 Flash Image), a qualidade e a velocidade reais das imagens geradas não apresentaram nenhuma melhoria perceptível e, em alguns cenários, foram até inferiores aos modelos da geração anterior.
O que realmente permitiu que o Nano Banana 2 ganhasse espaço foi sua relação custo-benefício extremamente acessível.
A partir de hoje, você pode usá-lo facilmente no aplicativo Gemini e na caixa de pesquisa do Google. Usuários comuns, sem assinatura, podem obter 100 ingressos gratuitos em até 24 horas; já os assinantes Pro recebem até 1000 ingressos.
Para desenvolvedores, o preço da API foi reduzido pela metade, agora custando apenas metade do preço do modelo Pro da geração anterior. Isso se traduz em um custo de geração de uma única imagem 4K de alta resolução de aproximadamente US$ 0,15.

▲ Link fornecido: https://ai.google.dev/gemini-api/docs/pricing#gemini-3.1-flash-image-preview
É claro que, quanto mais a IA consegue produzir em massa imagens de alta resolução a um custo e velocidade extremamente baixos, mais as pessoas ficam apreensivas. Com a internet inundada de imagens falsas, o ditado "ver para crer" já não se sustenta. Se qualquer pessoa consegue gerar uma foto praticamente idêntica em um segundo, como podemos diferenciar uma da outra?
O Google está ciente disso e, por isso, atualizou sua tecnologia antifalsificação. O Nano Banana 2 aprimora ainda mais o suporte para a marca d'água digital SynthID e as credenciais de conteúdo C2PA, tornando mais claro se uma imagem foi gerada por IA e como ela foi modificada.
Segundo as estatísticas, essa função de verificação no Gemini foi chamada mais de 20 milhões de vezes desde novembro do ano passado.
O desenvolvimento de gráficos com inteligência artificial nos últimos dois anos tem sido realmente impressionante. Vivenciamos o deslumbramento inicial com o Nano Banana Pro, bem como a configuração trabalhosa e a longa espera. O lançamento do Nano Banana 2 busca combinar ainda mais qualidade e velocidade, além de reduzir significativamente a barreira de entrada para os usuários.
Uma ideia que surge de repente não precisa mais de revisões repetidas e esperas ansiosas. No momento em que você aperta Enter, ela está lá. Natural, simples e instantaneamente disponível — isso soa comum, mas ser capaz de fazer isso é realmente notável.
#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

