O Genie 3 provocou uma queda acentuada nas ações de empresas de jogos, mas a verdadeira essência dos jogos — a inteligência artificial — jamais será encontrada.

Na semana passada, o Google DeepMind lançou a terceira geração do seu modelo de linguagem visual, o Genie 3. Imediatamente após o lançamento, as ações de empresas globais de jogos caíram.
A gigante do setor de jogos, Unity, chegou a despencar mais de 24% em determinado momento, com grandes desenvolvedoras como Take-Two, Nintendo e CD Projekt Red sofrendo perdas. A tendência de queda continuou nesta semana.

A lógica por trás da reação drástica no mercado de capitais é simples e brutal:
Como os modelos podem gerar rapidamente mundos 3D incrivelmente realistas e interativos, qualquer pessoa pode criar jogos de nível AAA. Será que todas aquelas empresas que investiram centenas de milhões de dólares e passaram dez anos aprimorando um jogo/ferramenta de desenvolvimento não iriam à falência?
À primeira vista parece razoável, mas, após uma análise mais detalhada, não parece estar totalmente correto.
Na minha opinião, essa é uma reação instintiva de pânico, que expõe uma concepção cognitiva equivocada: a de equiparar a geração de detalhes visuais à construção de um mundo completo.
Nem todos que sabem desenhar podem se tornar arquitetos. O mesmo princípio se aplica à construção de mundos no desenvolvimento de jogos.
GTA, Red Dead Redemption, World of Warcraft, The Legend of Zelda… Pergunte a qualquer jogador que já tenha se envolvido profundamente em um jogo de mundo aberto, e provavelmente ele terá sentimentos semelhantes:
O que realmente dá vida a um mundo de jogo nunca são os belos cenários ou a simples interatividade, mas sim a sensação sutil, porém profunda e inefável de "vida".

Demo é apenas uma demonstração.
O vídeo de demonstração do Genie 3 foi realmente impressionante.
Basta fornecer um texto, uma imagem de referência ou uma ilustração feita à mão, e o programa consegue gerar cenas que lembram GTA e The Legend of Zelda em tempo real, em uma quantidade incrível de tempo. Os jogadores podem explorar essas cenas por um período, assumindo o papel de um "personagem do jogo" vagando por um mundo notavelmente realista.

Para um observador externo sem conhecimento técnico, Genie 3 certamente parece ser o "ápice do desenvolvimento de jogos".
Mas uma demo é apenas uma demo, e está longe do que a indústria de jogos considera uma demo "jogável" ou "técnica".
O Genie 3 é essencialmente um modelo autorregressivo de geração de quadros. A geração de quadros não é um conceito novo; ela existe há muito tempo nas indústrias de jogos e de tecnologia de placas gráficas. Em termos mais simples, funciona analisando os últimos quadros, estimando a disposição dos pixels do próximo quadro, gerando um novo quadro e repetindo esse processo.
O ponto crucial é que a geração de frames do Genie 3 se baseia em "adivinhação" em vez de programação rigorosa, e não há nenhum cálculo lógico confiável.
Em um jogo realista, quando um jogador arremessa uma bola de ferro, o motor do jogo usa fórmulas clássicas da física para calcular sua velocidade de queda. Quando o jogador liga uma lanterna e corre pela sala, o motor do jogo simula o traçado de raios e os materiais dos objetos iluminados para renderizar os efeitos de iluminação em tempo real.
No entanto, o Genie 3 não possui essas capacidades. Ele apenas forma uma "sensação" aproximada após observar dezenas de milhões de videoclipes, supondo que o objeto possa acelerar ao cair e que a luz projete uma sombra atrás dele.
Os efeitos que o Genie 3 "adivinhou" não são realistas. No mundo do jogo, efeitos irreais podem prejudicar seriamente a imersão.
Em diversas demonstrações, são frequentes os casos em que os personagens se desviam da história.
Genie 3 tem uma falha fatal: a falta de consistência a longo prazo. Sua janela de memória (na versão demo atual) é de apenas um minuto, no máximo. Uma vez que esse tempo é excedido, Genie 3 pode começar a esquecer a cena inicial e a estrutura do mundo entrará em colapso.
Em contraste, os jogos tradicionais podem preservar um estado fixo. A composição do mundo, cada elemento, é escrita nos arquivos do jogo e, após centenas de horas de jogo, cada fio de grama e cada árvore permanecem inalterados (a menos que você encontre um jogo como Red Dead Redemption 2, que pode preservar o esqueleto de um NPC ou os buracos de bala em uma árvore para sempre…).
Você consegue aceitar que, em um jogo, o mesmo lugar seja diferente a cada vez que você vai lá, ou até mesmo mude assim que você se vira?

O processo de decomposição de cadáveres ao longo do tempo em RDR2
Não só lhe falta memória, como o mundo conjecturado pelo modelo também carece de lógica complexa.
Atacar um NPC em GTA pode ter consequências diferentes dependendo se o NPC é um civil, um membro de gangue ou um policial. No entanto, essa complexa cadeia de lógica requer uma estrutura clara — ela precisa ser programada de forma rígida.
No entanto, o Genie 3 só consegue fornecer feedback com base em frames consecutivos. Embora as capacidades aprimoradas do modelo melhorem a coerência lógica, sem programação complexa, o feedback é inerentemente probabilístico. Em outras palavras, no mundo da geração de modelos, não há causalidade, apenas palpites vagos.
É importante esclarecer que, em comparação com seus antecessores e outros modelos visuais/de mundo, o Genie 3 oferece consistência e estabilidade significativamente aprimoradas. No entanto, experiências imersivas ainda ocorrem com bastante frequência, o que é inaceitável em um jogo.
Um mundo sem certezas é como carne e pele sem ossos; pode parecer se mover, mas não consegue se manter ereto.
Matt Bromberg, CEO da Unity, destacou que o resultado do modelo do mundo é "probabilístico" e carece das capacidades de simulação estruturadas e determinísticas dos motores de jogos tradicionais, tornando impossível manter uma experiência consistente para o jogador.

Somente através de um trabalho artesanal meticuloso é possível alcançar um senso de "vida".
Quando se trata de construir mundos de jogos, Red Dead Redemption 2 (RDR2) da Rockstar é uma referência incontornável.
Os dados de desenvolvimento desta obra-prima de mundo aberto são impressionantes: o criador Dan Houser revelou que o ciclo de desenvolvimento de RDR2 durou 8 anos, a equipe tinha milhares de pessoas, os roteiros estavam empilhados a vários metros de altura, a filmagem total de captura de movimento levou milhares de dias, mais de mil atores participaram e o orçamento de desenvolvimento e marketing ultrapassou os 500 milhões de dólares.
Esses elementos, em conjunto, contribuem para o nível de detalhes cativante de RDR2. Para criar uma América autêntica do final do século XIX, a equipe da Rockstar realizou uma extensa pesquisa, inspirando-se em locais reais e adaptando-os para criar uma cidade vibrante, porém caótica, bem como uma cidade fronteiriça desolada e sufocante. Os diálogos e as ações da grande maioria dos personagens principais e secundários foram meticulosamente elaborados. Até mesmo os milhares de NPCs possuem uma lógica comportamental única, alinhada à sua identidade e ambiente.
Mas isso é apenas a superfície. O que é assustador na Rockstar é sua atenção obsessiva a detalhes que os jogadores raramente observam por muito tempo.
O YouTuber Any Austin realizou uma pesquisa "complicada" sobre RDR2, revelando que o jogo possui, na verdade, um "sistema elétrico" completo, autoconsistente e surpreendentemente grande:
Quase todos os prédios com luz elétrica têm cabos de energia passando sob seus beirais. Esses cabos atravessam montanhas nevadas, pradarias, rios e pântanos, convergindo eventualmente para o mesmo prédio, a Lanik Electric Co. Nas florestas densas, algumas casas têm luz elétrica, mas ela está desligada ou quebrada, enquanto as que são habitadas usam velas ou lampiões a gás para iluminação.

A IA certamente pode gerar uma demonstração de 60 segundos que se assemelhe ao Velho Oeste, mas não consegue reproduzir detalhes tão minuciosos, precisos e realistas de um "sistema elétrico". E são justamente esses inúmeros detalhes aparentemente insignificantes, que podem passar despercebidos ao longo de todo o ciclo de vida do jogo, que, em conjunto, constituem a "sensação de vida" do mundo do jogo.
A discussão acima aborda apenas o aspecto "visual". Para a Rockstar Games, a construção de mundo vai muito além dos visuais; a "visão de mundo" é frequentemente ainda mais importante.
Tomando GTA5 como exemplo, uma das muitas sátiras ao mundo real que me impressionou particularmente foi a sua observação e representação da "ecologia da mídia".
O jogo incorpora uma enorme quantidade de conteúdo de rádio, televisão e internet. Comerciais de rádio vendem "Óleo do Deus Indiano", e apresentadores debatem argumentos de extrema esquerda ou extrema direita. Se você explodir o CEO de uma empresa de tecnologia em uma missão, não só verá rapidamente reportagens, como também as reclamações de internautas em plataformas fictícias de mídia social.

Retornando a RDR2, a história principal, as subtramas e a construção de mundo de toda a obra são, na verdade, um banquete estrutural que reflete o espírito da época.
Na transição entre o velho e o novo século, a natureza selvagem foi gradualmente engolida pela civilização, mas a civilização trouxe problemas inesperados. A gangue Van der Linde, à qual o protagonista pertence, representa a pedra angular da América moderna — o anarquismo, uma sociedade rude e desordenada mantida pela moralidade e pela justiça vigilante; enquanto a Agência de Detetives Pinkerton e os magnatas dos negócios e da política em vários lugares representam a direção da maré — a ordem moderna.
Além disso, tendo como pano de fundo uma era próspera, porém corrupta, a experiência individual de Arthur ao navegar entre as relações legais e humanas faz com que os jogadores sintam a sensação opressiva e sufocante de que "pessoas boas não vivem muito".
A verdadeira essência de um jogo reside em seus personagens, missões, história e construção de mundo. Um mundo sem esses detalhes meticulosamente elaborados está fadado a ser vazio e oco.
Numa era em que modelos complexos podem ser gerados pixel a pixel instantaneamente, a abordagem "laboriosa" da Rockstar destaca o valor humanístico da arte feita à mão. É claro que a IA sem dúvida se tornará mais poderosa, mas provavelmente terá dificuldades em simular a "alma" imbuída de vieses históricos específicos e profundidade literária. E são precisamente essas chamadas almas que são os verdadeiros motivos pelos quais os jogadores amam jogos excelentes.

A IA não consegue gerar IPs — na melhor das hipóteses, ela só consegue copiar.
Outra questão fundamental que precisa ser abordada: o que exatamente os jogadores adoram nos jogos?
A resposta muitas vezes reside não apenas no próprio jogo (enredo, mecânicas, etc.), mas também na propriedade intelectual do jogo.
O valor de uma propriedade intelectual vai muito além de uma única obra.
Tomemos a Nintendo como exemplo. A franquia Mario foi criada em 1985. Nos últimos 40 anos, a Nintendo lançou mais de 200 jogos com esse encanador de chapéu vermelho, abrangendo quase todas as categorias, como jogos de plataforma, corrida, esportes e RPGs.
De Super Mario Bros. a Mario Odyssey, de Mario Kart a Mario Party, cada novo título fortaleceu o conhecimento e a conexão emocional dos jogadores com a franquia.
Lançado em 2023, "Super Mario Bros.: O Filme" arrecadou mais de US$ 1,3 bilhão em todo o mundo, tornando-se a adaptação cinematográfica de videogame de maior bilheteria de todos os tempos. Essa conquista não se deve a nenhum aspecto inovador do filme em si, mas sim à conexão emocional que gerações construíram com a franquia Mario .
Construir uma propriedade intelectual exige tempo, consistência, investimento a longo prazo e gestão cuidadosa por parte do criador.
Uma boa franquia de jogos não se resume apenas a criar bons jogos, mas sim a criar bons jogos de forma consistente. Nenhuma dinastia dura para sempre. O recente declínio de Assassin's Creed, da Ubisoft, e Call of Duty, da Activision, duas franquias bastante conhecidas, é uma excelente prova dessa lógica.
A Rockstar Games dedicou quase 30 anos, desde o lançamento do primeiro Grand Theft Auto (GTA) em 1997, a aprimorar a série até transformá-la no ápice dos jogos de mundo aberto que é hoje. Cada novo título da franquia GTA mantém o espírito satírico e a temática criminal, ao mesmo tempo que inova constantemente em termos de jogabilidade e narrativa.
Essa consistência inspirou confiança nos jogadores em relação ao GTA: eu sei qual será o tom do próximo GTA, mas estou ainda mais ansioso para ver quais novas surpresas ele trará.
Esse tipo de relação de confiança não pode ser gerado pela IA isoladamente.

Mais importante ainda, a gestão de propriedade intelectual é um projeto sistêmico complexo. Quais elementos podem mudar e quais devem permanecer constantes? É preciso estabelecer consistência entre as diferentes obras, fazendo com que os fãs sintam: "Este é o mundo". Lance as sequências quando for a hora certa e liberte-se do pensamento habitual e da memória muscular quando necessário. A gestão de propriedade intelectual envolve uma série de questões comerciais e legais, incluindo direitos autorais, licenciamento e adaptações transmídia…
A série Metal Gear de Hideo Kojima é um excelente exemplo. De 1987 a 2015, Kojima passou quase 30 anos construindo uma vasta visão de mundo que engloba múltiplos temas, como a Guerra Fria, a dissuasão nuclear, a era da informação e a biotecnologia, através de cinco séries principais e inúmeras obras derivadas.
Cada jogo da série dá continuidade aos personagens e às histórias do anterior, mas com ajustes criativos e novas reflexões filosóficas. Essa continuidade narrativa e profundidade temática que se estende por décadas fazem de Metal Gear uma das franquias mais respeitadas da história dos jogos.
A Konami demitiu Kojima em 2015. Embora ainda detenha os direitos autorais de Metal Gear Solid, os fãs geralmente sentem que a essência da franquia se perdeu. Mesmo com remakes posteriores apresentando gráficos mais bonitos e jogabilidade aprimorada, é difícil recapturar a mesma conexão emocional com os jogadores.
Isso revela uma dura verdade: o valor essencial de uma propriedade intelectual não reside em seus materiais e código, mas no investimento contínuo do criador e na conexão emocional com os jogadores.
O Genie 3 consegue gerar um mundo que lembra The Legend of Zelda em um minuto, mas não consegue criar a conexão emocional que os jogadores têm com Link, Zelda e Hyrule. Ele pode imitar o estilo de fantasia medieval de The Witcher, mas não consegue proporcionar os dilemas morais que Geralt enfrenta, caminhando na tênue linha entre o certo e o errado.
Assim, quando os investidores entram em pânico e vendem ações de empresas de jogos, podem estar ignorando uma questão fundamental: empresas de jogos verdadeiramente valiosas detêm não apenas ferramentas e tecnologia de desenvolvimento, mas também propriedades intelectuais que foram cultivadas ao longo de décadas e estão profundamente enraizadas no coração dos jogadores.
A IA pode produzir conteúdo rapidamente, mas a propriedade intelectual (PI) requer um acúmulo lento. São duas escalas de tempo completamente diferentes. No ano passado, comemoramos o 40º aniversário do Mario, e este ano comemoramos o 40º aniversário de The Legend of Zelda — o valor dessas PIs não pode ser abalado pela IA no curto prazo.

A IA é o pincel, e as pessoas são os pintores.
Esses princípios certamente não precisam de um artigo dedicado para serem explicados. Qualquer pessoa que aprecie a estética nos jogos e busque uma experiência de jogo superior deveria compreendê-los.
Portanto, acredito que o viés cognitivo temporário e o pânico certamente passarão. Os excelentes desenvolvedores de jogos receberão um valor de mercado justo, compatível com a qualidade, habilidade e criatividade de seu trabalho.
No entanto, a direção do desenvolvimento tecnológico demonstrada pelo Genie 3 certamente merece ser explorada.
No fluxo de trabalho real de estúdios de jogos AAA, a IA de fato começou a desempenhar um papel importante. Por exemplo, na fase de concepção do conceito, são utilizadas instruções para gerar imagens ou cenas 3D para uma rápida pré-visualização do estilo e construção de protótipos; na fase de produção de recursos, ferramentas de IA são usadas para gerar rapidamente recursos com diversas texturas.
Fornecer essas ferramentas a grandes estúdios pode melhorar a produtividade até certo ponto, enquanto fornecê-las a desenvolvedores individuais pode reduzir significativamente sua carga de trabalho.
Da mesma forma, para os desenvolvedores de jogos e até mesmo para toda a indústria de jogos, Genie 3 deveria ter sido um grande sucesso — e é por isso que a consequente queda nos preços das ações das empresas de jogos me deixa tão intrigado.
Quando GTA7 for lançado, a Rockstar poderá usar o Genie 3 para gerar latas de lixo na beira da estrada, conversas com NPCs e até mesmo fases, cenas e personagens completos.
No entanto, onde e como esses materiais serão colocados, e o papel que desempenharão em uma missão específica e no contexto geral do mundo, ainda será determinado pelos designers de personagens, missões, níveis, ambientes e mundos da Rockstar.
A IA se tornará um super pincel para desenvolvedores de jogos. Mas somente nas mãos de "pintores" humanos ela poderá criar obras-primas com profundidade cultural e impacto social.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

