Como a IA generativa criará jogos com ‘mundos mais amplos, maiores e mais profundos’

De todos os casos de uso de IA generativa, não consigo pensar em um mais significativo do que os videogames. Claro, vimos pessoas criarem jogos simples a partir do GPT-4 — mas certamente presumi que uma tecnologia tão poderosa também estava sendo discutida nos níveis mais altos de desenvolvimento de jogos .

Para ter uma ideia de como isso pode ser uma grande mudança, eu queria falar com alguém que realmente entende como os jogos são feitos em um nível técnico. Marc Whitten, vice-presidente sênior e gerente geral da Unity Create, certamente é uma dessas pessoas. Ele está particularmente animado sobre como a IA pode transformar o desenvolvimento de jogos, e falamos sobre como as ferramentas que podem permitir essa revolução estão chegando aos criadores.

Tempo de criação mais rápido

Ziva Face Trainer em Unity.

Os jogos levam muito tempo e esforço para serem desenvolvidos, mas a maior parte desse tempo é dedicada à criação de todo o conteúdo do jogo. Whitton diz que se você olhar para um estúdio AAA comum de 300 pessoas, algo em torno de 80% deles são dedicados à criação de conteúdo. A IA pode acelerar drasticamente esse processo.

Whitton forneceu um exemplo claro disso: Ziva Face Trainer. A Ziva é uma empresa que a Unity adquiriu no início de 2022, e está trabalhando em sua ferramenta Face Trainer há pouco mais de dois anos. Ele pega um modelo, o treina em um grande conjunto de emoções e movimentos e gera algo utilizável.

Quanto tempo isso economiza? Whitton diz que o aparelhamento de ponta de um personagem pode levar de quatro a seis artistas de quatro a seis meses: “Sinceramente, [é] por isso que a qualidade de ponta dos personagens não progrediu tanto nos últimos dez anos ou mais.”

Com o Ziva Face Trainer, os desenvolvedores “dão uma malha e treinamos essa malha em um grande conjunto de dados… A tecnologia Ziva também está sendo muito usada. Está por trás da deformação do traje em Spider-Man: Miles Morales, bem como o Troll no trailer de Senua's Saga: Hellblade 2 . Você provavelmente já viu isso em alguns filmes e programas de TV – Capitão Marvel, John Wick 3 e Game of Thrones estão na lista.

Isso não deveria ser uma surpresa. Aprendizado de máquina e técnicas processuais (como ferramentas como SpeedTree) não são exatamente novas no mundo do desenvolvimento de jogos. É verdade que mais pesquisas sobre modelos de IA podem levar a canais de criação ainda mais eficientes, mas estamos vendo uma mudança na IA generativa. Estamos falando de modelos de linguagem grande (LLMs) como GPT-4 e modelos de difusão como Midjourney , e eles podem mudar radicalmente os jogos que vemos.

Mudando o jogo

Whitton diz que a esperança com a IA é tornar os jogos “dez a um terço melhores”, o que significa jogos dez vezes mais rápidos, dez vezes mais fáceis e dez vezes mais baratos de desenvolver. O resultado disso não é uma enxurrada dos mesmos jogos que temos. Whitton acredita que os resultados disso são “mundos mais amplos, maiores e mais profundos”.

Pedi um exemplo e Whitton ponderou como seria Skyrim se tivesse um modelo de IA generativo por trás dele. Todos nós já ouvimos o meme “flecha no joelho” do jogo, mas Whitton imaginou um jogo em que essa linha descartável significasse algo mais.

“Bem, e se cada um desses guardas realmente tivesse um gráfico do tipo Myers-Briggs? Um pouco de história de fundo e, francamente, uma história de fundo que poderia ter sido impactada por isso. O que aconteceu com o personagem ao longo do caminho? E então um modelo de IA para gerar o que seria uma resposta racional a partir disso, considerando todos esses eventos específicos.”

Estamos vendo algum esforço lá com jogos como The Portopia Serial Murder Case, que, sem rodeios, não fez o melhor caso para IA em jogos . Não é difícil ver o potencial, especialmente em jogos maiores com NPCs que não possuem missões definidas ou diálogos exaustivos.

Um jogador conversa com um NPC em The Portopia Serial Murder Case.

Também há muito potencial em jogos no estilo sandbox. Whitton imaginou um jogo estilo GTA onde você “vai até a loja de penhores e recruta a pessoa atrás da mesa e, você sabe, talvez com o criador do jogo nem mesmo pensando nisso como uma possibilidade por causa de outra coisa que aconteceu no jogo." Whitton também pensou em Scribblenauts, exceto em um mundo onde você poderia realmente fazer qualquer coisa e atribuir-lhe quaisquer propriedades.

O problema agora é fazer com que isso realmente funcione, como evidenciado por The Portopia Serial Murder Case. Whitten foi um dos membros fundadores da equipe do Xbox na Microsoft e ajudou a liderar o impulso do Kinect. Sobre o Kinect, Whitten disse: “Eu diria a todos que funciona muito bem se eu estiver sentado ao seu lado”. Você precisava solicitar de uma maneira específica e, se desviasse, não funcionaria.

Esse é o grande problema enfrentado pela IA como um todo, com assistentes inteligentes como Alexa operando apenas dentro de uma faixa estreita. Os LLMs mudam essa dinâmica e permitem qualquer solicitação, e é isso que é empolgante na criação de mundos de jogo mais profundos. Ainda há um caminho para chegar lá, no entanto.

“Se você colocar a ferramenta lá fora… [os criadores irão] atingir quaisquer limites e dizer, 'Bem, isso não é divertido.' Mas então eles vão realmente encontrar o espaço que ninguém está pensando”, disse Whitten.

Com o lançamento de mais ferramentas, poderemos ver alguns experimentos iniciais com IA no próximo ano. Já temos alguns casos, como o extremamente popular AI Dungeon 2. Mas para tornar esse tipo de mundo imersivo possível em escala, você precisa de um intermediário. E para Unity, esse intermediário é Barracuda.

A Barracuda

Uma imagem do Livro dos Mortos de Unity.

O Unity inclui uma biblioteca de inferência de rede neural chamada Barracuda. Como explica Whitten, “é um mecanismo de inferência que permite conduzir a difusão ou outras formas de conteúdo generativo em tempo de execução no dispositivo sem acessar a nuvem e em um ritmo de alto desempenho”.

Ah, sim, desempenho. Por mais que gostemos de falar que a IA pode mudar o conteúdo para sempre, há um enorme custo computacional (há uma razão pela qual foram necessárias dezenas de milhares de GPUs para criar o ChatGPT ). O Barracuda permite que esses modelos sejam executados em sua CPU ou GPU para que você não precise ir para a nuvem, o que, para constar, seria um grande desperdício de dinheiro para os desenvolvedores.

A Unity está trabalhando em mais recursos para o Barracuda, e Whitten diz que o “interesse da comunidade de criadores de jogos tem sido extraordinariamente alto”. É a chave que possibilita a IA generativa no desenvolvimento e design de jogos, especialmente sem a necessidade de nenhum hardware específico.

Whitten diz que a equipe quer começar a “construir técnicas que permitam aos criadores começar realmente a focar em uma parte grande e central do design de seus jogos, não 'Oh, isso vai realmente diminuir meu público se eu projetar para isso'”. Unreal Engine, por sua vez, tem uma ferramenta semelhante (a ferramenta apropriadamente chamada de NeuralNetworkInference, ou NNI).

Essas bibliotecas, quando confrontadas com grandes modelos generativos de IA e uma aceleração no desenvolvimento de conteúdo, podem levar a uma “explosão de criatividade”, de acordo com Whitten. E isso é algo para se entusiasmar com o futuro dos jogos.

Este artigo faz parte do ReSpec – uma coluna quinzenal contínua que inclui discussões, conselhos e relatórios detalhados sobre a tecnologia por trás dos jogos para PC.