Nvidia transforma prompts de texto simples em modelos 3D prontos para jogos

março 22, 2024 gurinho

Uma colagem colorida de imagens geradas pelo LATTE3D da Nvidia. — Nvidia

A Nvidia acaba de lançar seu novo modelo generativo de IA, apelidado de Latte3D, durante o GTC 2024. Latte3D parece ser ChatGPT com esteróides extremos. I é um modelo de texto para 3D que aceita prompts de texto simples e curtos e os transforma em objetos e animais 3D em um segundo. Muito mais rápido do que seus equivalentes mais antigos, o Latte3D funciona como uma impressão 3D virtual que pode ser útil para criadores de vários setores.

O Latte3D foi feito para simplificar a criação de modelos 3D para diversos tipos de criadores, como aqueles que trabalham com videogames, projetos de design, marketing ou mesmo aprendizado de máquina e treinamento em robótica. Na demonstração do modelo pela Nvidia, ele parece super simples de usar. Seguindo um rápido prompt de texto, a IA gera um modelo 3D e logo depois o finaliza com muito mais detalhes. Embora o resultado final não seja tão realista quanto o Sora da OpenAI , não deveria ser – esta é uma maneira de acelerar a criação de ativos em vez de ter que construí-los do zero.

O modelo gera diversas opções diferentes para o usuário escolher, e a Nvidia afirma que essas formas podem ser “otimizadas para maior qualidade em poucos minutos”. Os designs podem então ser exportados para diferentes plataformas, como o Omniverse da Nvidia, e podem ser ajustados para corresponder ao resultado final desejado. A Nvidia treinou o Latte3D usando suas GPUs Ada A100 Tensor Core e apoiou o treinamento com prompts ChatGPT para prepará-lo para interagir com usuários reais.

A partir de agora, o Latte3D só pode gerar objetos e animais. Para esse fim, parece fazer um trabalho sólido ao discernir diferentes animais, texturas e tipos de objetos. A Nvidia mostrou essas capacidades apresentando objetos como um guindaste comum de amigurumi (crochê) ou um gato esfinge de origami. O modelo foi ensinado a reconhecer várias espécies e, portanto, pode diferenciar um galgo italiano de um Shiba Inu.

Texto LATTE3D para modelo de IA generativa 3D da NVIDIA Research

Os criadores que desejam usar o Latte3D para fazer mais podem treiná-lo em um conjunto de dados diferente, sejam plantas ou objetos domésticos, e depois usá-lo para seus próprios fins. A Nvidia traz aqui alguns casos de uso interessantes, como treinar robôs assistentes pessoais antes de implantá-los. É fácil imaginar que o Latte3D será útil para desenvolvedores de jogos, mas o potencial vai muito além dos cenários de jogos.

Sanja Fidler, vice-presidente de pesquisa de IA da Nvidia, comentou como o Latte3D é muito mais rápido em comparação com seus antecessores: “Há um ano, demorava uma hora para que os modelos de IA gerassem visuais 3D desta qualidade – e o estado atual da arte agora é de cerca de 10 a 12 segundos. Agora podemos produzir resultados muito mais rápidos”, disse Fidler.

Os anúncios recentes relacionados ao uso de IA no desenvolvimento de jogos são bastante inovadores, e o Latte3D da Nvidia se junta a uma lista crescente de ferramentas que podem um dia mudar completamente o processo de criação de um jogo. Por exemplo, a Nvidia revelou recentemente personagens não-jogadores (NPCs) com diálogos inteiramente gerados por IA . Enquanto isso, a atualização mais recente do Unreal Engine pode gerar visuais com qualidade de filme em jogos em tempo real, tudo com a ajuda do aprendizado de máquina.