Após experimentar o recém-lançado GLM-5 da Zhipu, finalmente entendi por que o Vale do Silício está tão ansioso para desvendá-lo.

Há uma semana circulam rumores na internet sobre o misterioso modelo "Pony Alpha".

Alguns dizem que é um Claude 5 rebatizado, outros que é uma arma secreta de uma grande empresa. Agora, o mistério foi resolvido: este novo modelo, com o codinome "Pony Alpha", nada mais é do que a grande surpresa da Zhipu AI para o Festival da Primavera — o GLM-5.

▲Captura de tela da conta oficial do Zhipu no WeChat

Além disso, era de código aberto.

Se 2025 foi o ano em que a IA aprendeu a escrever código, então, no início de 2026, como previsto por Andrej Karpathy, ex-diretor de IA da Tesla, podemos estar prestes a entrar na era da "Engenharia Agentiva".

No entanto, em comparação com o GPT-5.3-Codex e o Claude Opus 4.6, o primeiro a tornar isso uma infraestrutura de código aberto foi o modelo nacional GLM-5.

Aqui está o link para experimentar:

  • Z.ai: https://chat.z.ai
  • Versão do APP/Web Zhipu Qingyan: https://chatglm.cn

O produto que enganou a Pony.a. Alpha no Vale do Silício era, na verdade, uma fachada para o Zhipu GLM-5.

Já não é surpresa ver IA criando programas como Snake ou Tetris. O verdadeiro teste é colocá-la à prova com algo desafiador.

Apresentamos ao GLM-5 um requisito de simulação física muito específico:

Crie um programa de simulação interativo em HTML, CSS e JavaScript que simule o processo de um satélite enviando sinais para receptores terrestres. A simulação deve mostrar um satélite orbitando a Terra e enviando periodicamente sinais que são recebidos por múltiplos receptores terrestres.

Em vez de fornecer o código imediatamente, o programa fez uma breve pausa (simulando um processo de pensamento) antes de finalmente gerar uma página HTML de acordo com minhas especificações. Na tela, o satélite não estava apenas orbitando; a transmissão do sinal apresentava até mesmo uma animação de propagação ondulatória que se conformava à metáfora visual do efeito Doppler.

Compreende as leis físicas por trás da palavra "simulação", e não apenas o ato de "desenhar".

Em seguida, aumentamos a dificuldade.

Um usuário chamado @scaling01 no fórum X deu uma classificação muito alta: "Pony-Alpha ou é uma IAG ou memorizou meu banco de perguntas sobre SVG."

Para verificar isso, testamos uma tarefa extremamente abstrata em Python: "Visualizar como os semáforos funcionam em uma rua de mão única, com veículos entrando em taxas aleatórias."

Em menos de 3 minutos, surgiu um mapa de simulação dinâmica do fluxo de tráfego.

A lógica é impecável: semáforos verdes permitem a passagem, semáforos vermelhos exigem fila, e a aleatoriedade da aceleração e desaceleração dos veículos é simulada muito bem. No entanto, a estética dessa interface… bem, digamos que é um pouco "rudimentar".

Um internauta, @anurudhsharmaa, chegou a usar uma única linha de texto para criar um site esteticamente agradável.

Entretanto, o usuário @zakarinoo7 criou um reprodutor de mídia totalmente funcional que suporta decodificação de MP4/MP3, gerenciamento de listas de reprodução e ainda inclui uma interface de usuário com modo escuro, tudo isso em apenas 15 MB após a compilação.

Essa cena me deixou extremamente ansioso para experimentar. Então, mais uma vez usei o Claude Code para que o GLM-5 criasse um jogo de mundo aberto com bonecos palito para mim.

Em vez de me apressar a escrever código, adotei uma abordagem muito "humana": começando pela pilha de tecnologia, pela jogabilidade principal e pela construção do mundo, fui me alinhando gradualmente às minhas necessidades.

E durante o processo de "construção", posso agir como um cliente exigente, ultrapassando os limites dos requisitos originais e inserindo novas ideias a qualquer momento:

  • Ficar correndo pelo mapa é muito chato; precisa haver um sistema econômico, com moedas de ouro aparecendo aleatoriamente no chão.
  • Vamos adicionar alguns elementos de ação: pressione J para atirar uma flecha e K para realizar um ataque corpo a corpo.
  • Onde coloco os itens que encontro? Além disso, adicione uma interface de mochila que eu possa acessar pressionando a tecla I.
  • Os bonequinhos de palito à beira da estrada não podem ser apenas decoração; preciso que eles possam interagir com os NPCs.

Quando finalmente funcionou, o efeito só pôde ser descrito como "perfeito":

Como ele afirma ser arquiteto de sistemas, após o lançamento do GLM-5 no site oficial, também pedi a ele que criasse um sistema para Mac para ele.

Embora o design geral seja um tanto rudimentar, o fundo clássico da tela, a exibição da sincronização de tempo na barra de status superior e a disposição dos ícones no Dock inferior são todos "desenhados". E, surpreendentemente, todos os aplicativos presentes na tela podem ser abertos.

Compatível com metade da indústria de chips, essa é a "característica matadora" do GLM-5.

Os resultados dos testes de desempenho mostram que o GLM-5 atinge o estado da arte (SOTA) tanto em codificação quanto em capacidades do agente.

Os dados não mentem. Nos dois benchmarks de programação mais notoriamente difíceis, SWE-bench-Verified e Terminal Bench 2.0, o GLM-5 obteve pontuações de 77,8 e 56,2, respectivamente. Em termos de experiência de programação no mundo real, ele se aproxima muito do Claude Opus 4.5.

Como o GLM-5 consegue isso? Analisando o relatório oficial, por trás de uma série de parâmetros, encontramos alguns pontos-chave: a arquitetura MoE e o aprendizado por reforço assíncrono.

Com um total de 744 bytes de parâmetros e apenas 40 bytes de parâmetros de ativação, ele é inteligente e leve. Mas seu grande diferencial é o novíssimo framework "Slime", desenvolvido pela Zhipu.

Simplificando: no passado, o treinamento de modelos era como fazer uma "prova", onde você ganhava um ponto para cada questão respondida corretamente, e o modelo memorizava freneticamente as perguntas para obter uma pontuação alta; o treinamento do GLM-5, por outro lado, é como um "estágio". Em um ambiente chamado Slime, ele aprende concluindo uma série de projetos de longo prazo e por meio de feedback e interação contínuos.

Além disso, integra pela primeira vez o DeepSeek Sparse Attention. Isso significa que, ao lidar com contextos contendo centenas de milhares de linhas de código, não só evitará que o código se perca, como também reduzirá significativamente os custos de implantação.

Mas o que mais me impressionou foi a longa lista de agradecimentos no final do anúncio oficial. O modelo em larga escala desenvolvido internamente agora consegue operar de forma estável com alta taxa de transferência e baixa latência em clusters de chips produzidos no país.

Huawei Ascend, Moore's Threads, Cambricon, Kunlun Chip, Muxi, Suiyuan, Hygon…

▲ Dá a impressão de um Khan realizando uma grande revista militar.

Isso representa quase metade da indústria de semicondutores da China, o que significa que a abertura do código-fonte do GLM-5 não é apenas uma vitória de software. Significa que o ecossistema doméstico de IA — desde o poder computacional dos chips subjacentes até a estrutura intermediária e, em seguida, o modelo de nível superior — formou gradualmente um ciclo fechado completo.

Com o lançamento do GLM-5 em código aberto e sua integração com ferramentas populares como Claude Code e OpenCode, podemos estar no limiar da Engenharia de Software 2.0.

A era da "engenharia de agentes", prevista por Andrej Karpathy, ex-diretor de IA da Tesla, está chegando mais cedo do que o esperado. No futuro, talvez não seja mais necessário projetar os componentes linha por linha. Bastará definir o sistema, a estética e o que é "divertido" e "útil".

Em seguida, observe um modelo complexo como o GLM-5 agindo como um capataz, direcionando o poder computacional subjacente para construir arranha-céus.

A era tradicional dos "programadores" pode realmente estar chegando ao fim.

Mas não se assuste, isso não significa que os humanos sejam inúteis. Pelo contrário, quando a IA cuidar das complexidades da implementação, seu senso estético, seu discernimento e sua capacidade de fazer boas perguntas se tornarão a última e mais sólida barreira de proteção da humanidade.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

ifanr | Link original · Ver comentários · Sina Weibo