Acaba de ser anunciado o anúncio bombástico do grupo ATH (Alibaba’s Internet Technology and Services), da Alibaba: “Wukong” (Rei Macaco)! Com a entrada em cena de suas forças de elite no mercado corporativo, os “lagostas” (referindo-se aos gigantes da tecnologia da Alibaba) certamente causarão alvoroço.

Na noite passada, o Alibaba anunciou repentinamente a criação do grupo de negócios Alibaba Token Hub (ATH), com o CEO Wu Yongming diretamente no comando. Esta pode ser a reestruturação organizacional mais importante do Alibaba na era da IA.

Tokens: a moeda universal da era da IA.

A lógica de Wu Yongming é que, no futuro, uma grande quantidade de trabalho digital será suportada e operada por "centenas de bilhões de agentes de IA", e a operação desses agentes será impulsionada por tokens gerados pelo modelo.

A criação, distribuição e aplicação de tokens serão o novo foco principal do Alibaba.

O memorando interno também incluía um nome que apareceu publicamente pela primeira vez: Unidade de Negócios Wukong. O posicionamento oficial da Unidade de Negócios Wukong é: "Construir uma plataforma de trabalho B2B nativa de IA, integrando profundamente as capacidades do modelo aos fluxos de trabalho empresariais."

Em outras palavras, o DingTalk original foi elevado a uma posição estratégica mais central, trabalhando em conjunto com o Qianwen para apoiar os objetivos de IA da Alibaba nos setores B2B e B2C, respectivamente.

Nesta conferência de imprensa, a Unidade de Negócios WuKong apresentou seu primeiro projeto desde a sua criação – o aplicativo carro-chefe de IA para empresas "WuKong", que também é a primeira plataforma de trabalho nativa de IA centrada em agentes inteligentes empresariais.

Este é o segundo dia desde a criação do grupo empresarial ATH, e o CEO do Alibaba Group, Wu Yongming, também compareceu ao evento de lançamento do "Wukong" hoje.

Recentemente, após a tendência de "criar lagostas" ter se espalhado pelas redes sociais, todos passaram a acreditar que a IA realmente pode controlar computadores e ajudar em tarefas.

No entanto, em meio a esse caos, os robôs continuaram apagando e-mails, dados sensíveis eram lidos à vontade pela IA, e a maioria dos usuários corporativos parou por aí depois que o departamento de TI da empresa disse: "Isso não está em conformidade".

O estado atual dos agentes de IA e seu potencial para adoção em larga escala ainda são questões técnicas. A verdadeira questão é se as organizações se atreverão a usá-los .

A APPSO resumiu rapidamente os pontos principais da conferência de imprensa para todos os presentes:

  • WuKong: A primeira plataforma de trabalho nativa de IA do mundo, centrada em agentes inteligentes empresariais, que oferece segurança aprimorada e capacidade de entrega comercial.
  • RealDoc, o primeiro sistema de arquivos nativo de IA: cada operação é rastreável e pode ser revertida.
  • O DingTalk agora é totalmente compatível com a linha de comando (CLI): o código subjacente foi reescrito para criar uma linguagem operacional nativa para IA, permitindo acesso seguro via CLI aos aplicativos e dados do DingTalk.
  • 10 principais soluções do setor OPT: e-commerce individual, loja virtual individual, blogueiro de conhecimento individual… Habilidade é igual a produtividade
  • Mercado de Capacidades de IA: Foi lançado um ecossistema completo de habilidades em nível empresarial, totalmente integrado a um sistema unificado de varredura de segurança e gerenciamento hierárquico.
  • Hardware de IA: a placa de gravação A1 Pro e os fones de ouvido Cleer H1 AI fazem sua estreia.
  • Arquitetura de segurança empresarial de nível nativo: isolamento subjacente em sandbox e auditoria de ponta a ponta, permitindo que as empresas realmente ousem usar IA.

O DingTalk foi desenvolvido para IA.

Antes de entendermos o Wukong, precisamos desfazer um estereótipo: definitivamente não é "o DingTalk com uma caixa de diálogo de IA adicionada". Vale a pena repetir essa afirmação : Wukong não é o DingTalk com uma função de IA adicional .

Nos últimos dois anos, vimos muitos exemplos de "produtos com IA integrada": o Word adicionou o Copilot, o WeChat adicionou o Yuanbao (um recurso para adicionar IA a produtos) e as páginas da web adicionaram botões de resumo. A lógica por trás desses produtos é: as funções originais permanecem inalteradas e a IA é adicionada como uma camada auxiliar para ajudar você a escrever, aprimorar e resumir.

A lógica de Wukong é completamente diferente.

Wukong é uma plataforma de trabalho nativa de IA centrada em agentes inteligentes empresariais . Ela pode operar nossos computadores, editar arquivos locais, executar aplicativos de desktop e conectar-se ao conjunto completo de produtos do DingTalk, incluindo documentos, aprovações, agendas e notas.

Quando você diz a Wukong: "Ajude-me a compilar todos os registros das visitas de clientes da semana passada em um relatório semanal e envie-o ao Gerente Geral Zhang para confirmação."

O Wukong não fornecerá um modelo para você preencher. Em vez disso, ele abrirá diretamente a pasta de registro de visitantes no seu computador, lerá cada registro, gerará um relatório semanal, o salvará em um local especificado e o enviará ao Sr. Zhang para aprovação via DingTalk.

Durante toda a conversa, você disse apenas uma frase.

Mais importante ainda, seu celular pode comandar o Wukong remotamente para concluir tarefas no seu ambiente local. Você não precisa ficar sentado em frente a um computador. A caminho de uma reunião com um cliente, basta enviar uma mensagem e o Wukong terminará o trabalho para você em casa.

Essa é a arquitetura de trabalho do Agente, que consiste em "execução local + controlabilidade remota", e que também é a nova forma de trabalho definida por Wukong: você pode realizar tarefas simplesmente dizendo uma frase.

▲Experimente aqui: https://www.dingtalk.com/wukong

Wukong e OpenClaw: Resolvendo o mesmo problema usando folhas de respostas diferentes

A primeira reação de muitas pessoas é: Não é esta apenas a "versão chinesa do OpenClaw"?

Superficialmente, ambos envolvem IA operando computadores, mas sua relação é mais próxima da relação entre "a comunidade de código aberto do Linux" e "Red Hat Enterprise Edition". Compartilham as mesmas tecnologias subjacentes, mas visam campos de batalha completamente diferentes.

O OpenClaw provou o conceito de que agentes de IA podem controlar computadores . Ele se baseia em "simulação visual" e na linha de comando nativa do sistema operacional para permitir que a IA olhe para a tela e clique com o mouse como um humano. Essa abordagem é interessante, mas também frágil. Afinal, se a interface for atualizada ou os comandos forem modificados, todo o processo pode falhar.

Mais importante ainda, o OpenClaw, quando executado localmente, possui privilégios de sistema quase idênticos aos do usuário. Teoricamente, o computador de um estagiário executando o OpenClaw poderia ler quaisquer dados aos quais ele não deveria ter acesso. Agências de segurança descobriram centenas de programas maliciosos em seu mercado de habilidades, e o Gartner classificou sua implantação corporativa como um "risco inaceitável de segurança cibernética".

O OpenClaw é o "momento Linux" para agentes — de código aberto, gratuito, voltado para a comunidade geek e com um ecossistema próspero, mas nenhuma empresa se atreve a usá-lo diretamente.

O problema que o Wukong precisa resolver é diferente : ser compatível com todas as funcionalidades do ecossistema de código aberto e incorporar a segurança à arquitetura, em vez de corrigi-la posteriormente.

Autenticação unificada de identidade empresarial, isolamento dedicado em sandbox, gerenciamento de proxy de rede e logs de auditoria de ponta a ponta — cada camada de segurança responde à mesma pergunta: capacitar os departamentos de TI a tomar decisões e capacitar os CEOs a assumir a responsabilidade .

Essa é a diferença fundamental entre o Enterprise Agent e os "frameworks de agentes de código aberto".

Na conferência de imprensa, o CEO da DingTalk, Wu Zhao, afirmou: "Hoje, desconstruímos o DingTalk, reconstruímos com IA e criamos o Wukong. No passado, as pessoas usavam o DingTalk para trabalhar; no futuro, a IA usará o DingTalk para trabalhar. Ao contrário de todos os outros assistentes virtuais disponíveis no mercado, o Wukong se integra naturalmente às organizações empresariais e pode ser usado com segurança em ambientes corporativos reais. "

Interface de linha de comando: Criando uma linguagem operacional nativa para IA

Para entender por que o Wukong "realmente consegue realizar tarefas", a chave é que ele possui uma linguagem que permite à IA "entender" o software.

No passado, quase todos os agentes de IA tentaram simular as operações humanas de teclado e mouse. Isso é como usar um computador de olhos vendados e depender de alguém para dizer "mova um pouco para a esquerda, clique" — não é apenas extremamente ineficiente, mas também extremamente propenso a erros.

Para permitir que o Wukong realmente "realizasse tarefas", a DingTalk tomou uma decisão bastante ousada: todo o código subjacente foi reescrito .

Eles transformaram completamente as funcionalidades existentes do DingTalk em uma interface de linha de comando (CLI), convertendo-o de uma "interface gráfica para humanos" em uma "interface de linha de comando para IA".

A IA não precisa mais "entender" onde está o botão, mas pode acessar diretamente as funcionalidades por meio de instruções padronizadas, o que equivale a instalar terminações nervosas na IA .

Isso inclui todos os produtos DingTalk, incluindo documentos, agendas, aprovações, reuniões e até planilhas de IA, todos reescritos para comandos CLI padrão.

Isso significa que Wukong não precisa mais "clicar" em botões como um humano, mas pode acessar diretamente todos os recursos e dados do DingTalk por meio de comandos nativos.

Além do aplicativo DingTalk, as principais funcionalidades de negócios do Alibaba Group, incluindo Taobao, Tmall, Alipay e Alibaba Cloud, serão gradualmente integradas ao Wukong como Skills. O Wukong está se tornando uma plataforma unificada para as capacidades de IA do Alibaba em cenários de trabalho corporativos.

Quando um usuário diz: "Ajude-me a organizar os registros de visitas de clientes da próxima semana e gerar um relatório semanal", o Wukong não apenas "entende" a frase; em vez disso, ele aciona diretamente uma série de comandos da CLI: chama a API de agendamento → recupera os dados do CRM → executa a análise da ditagem → grava em um documento → inicia um fluxo de trabalho de aprovação. Todo o processo não envolve cliques simulados, nem reconhecimento visual, apenas chamadas precisas de máquina para máquina.

Essa lógica é expressa com muita precisão em um relatório do setor intitulado "O futuro pertence aos agentes inteligentes: IA bilionária está redefinindo o software":

Tudo o que você construir deve ser API-first. Se uma funcionalidade não tiver uma API, é como se ela não existisse. Se você não puder expô-la via CLI ou servidor MCP, estará em desvantagem.

Em outras palavras, numa era em que os agentes de IA se tornam os "usuários primários" do software, o software que não pode ser invocado nativamente pela IA é essencialmente inexistente .

▲Fonte da imagem: X@karpathy

A DingTalk compreendeu essa lógica e, por isso, optou por uma abordagem extremamente dispendiosa: reescrever a camada subjacente do produto que atende 800 milhões de usuários e 27 milhões de empresas em todo o mundo. Somente após a DingTalk estar totalmente habilitada para interface de linha de comando (CLI), o Agente pôde se transformar de simplesmente "capaz de conversar" para "capaz de trabalhar".

Realdoc: A IA finalmente tem sua própria linguagem nativa de manipulação de arquivos.

No entanto, a implementação da CLI resolve apenas o problema de "se a IA consegue chamar o DingTalk". Existe uma questão mais fundamental e frequentemente negligenciada : como a IA manipula arquivos ?

Atualmente, quase nenhum produto de agente de IA no mercado possui um sistema de arquivos projetado especificamente para IA. Todos estão se virando com sistemas de arquivos tradicionais, e qual é o resultado?

Para que a IA corrija uma única palavra em um documento, ela precisa primeiro ler o documento inteiro, carregá-lo na memória, fazer a correção e, em seguida, reescrever o documento inteiro. É como corrigir um erro de digitação em um livro, mas ter que reescrever o livro inteiro — absurdo, mas é a realidade.

Isso leva a três reações em cadeia.

Primeiro, há a questão da explosão de tokens. Cada operação consome o documento inteiro, fazendo com que os custos disparem. Um usuário testou a criação de um PPT usando IA, que consumiu 270 milhões de tokens, o equivalente a cerca de US$ 500.

Em segundo lugar, não há como desfazer as alterações. A IA sobrescreve e entra em vigor imediatamente. Se você cometer um erro, não há como reverter a alteração e você só poderá começar do zero.

Por fim, há a questão dos arquivos que saem do controle. Os agentes criam arquivos aleatoriamente, e as empresas não têm ideia de onde a IA está gerando o quê, resultando em uma bagunça desorganizada que não é identificável nem gerenciável.

Para isso, Wukong construiu do zero um sistema de arquivos nativo para IA chamado Realdoc. Esta é a primeira vez na indústria que alguém redesenha uma linguagem de operação de arquivos especificamente para IA .

No RealDoc, Wukong pode operar como um cirurgião, localizando informações por número de linha e palavra-chave, fazendo alterações apenas nas partes necessárias e deixando o restante intacto. O consumo de tokens é significativamente reduzido, eliminando a necessidade de reler todo o documento apenas para alterar uma única palavra.

Mais importante ainda, há o gerenciamento de versões. O Realdoc salva automaticamente um instantâneo completo para cada etapa realizada pela IA — como um ponto de salvamento automático em um jogo. Cada ação é registrada, permitindo que você reverta para qualquer versão a qualquer momento. Ele também pode comparar automaticamente as diferenças entre dois instantâneos, até mesmo as alterações em cada linha.

Há também a questão da propriedade dos arquivos. O Realdoc aloca um espaço de trabalho independente na nuvem para cada Agente de IA, fornecendo a cada documento produzido pela IA uma "conta" clara — onde está armazenado, quem o criou e qual Agente o modificou e quando, tornando-o facilmente acessível aos gestores da empresa.

Nesse ponto, a Wukong fez uma mudança que a maioria dos produtos de nível empresarial ainda não havia percebido: em vez de aplicar IA a ferramentas existentes, ela queria criar um novo conjunto de ferramentas para IA .

Wukong lança dez pacotes de habilidades OPT com colaboração nativa em DingTalk.

Se as soluções baseadas em linha de comando resolvem o problema de "como a IA funciona", a próxima questão é: quais tarefas a IA deve executar e quem lhe dirá como executá-las ?

A resposta é: Habilidade.

Skill é a menor unidade de produtividade da Wukong — um módulo de capacidade que engloba procedimentos operacionais padrão (SOPs) de especialistas do setor e pode ser invocado diretamente. Não precisamos entender de IA, nem escrever instruções; com um clique, a equipe de IA entra em ação imediatamente.

Este não é um conceito novo, mas Wukong o elevou a um nível completamente novo.

A Wukong lançou seu primeiro lote de kits de habilidades OPT (One Person Team) para dez setores, abrangendo dez cenários: e-commerce individual, e-commerce internacional, blogueiros de conhecimento, desenvolvimento, varejo, design, manufatura, direito, finanças e tributação, e recrutamento executivo. Cada pacote setorial inclui diversas habilidades sequenciais predefinidas, condensando fluxos de trabalho que antes exigiam colaboração em equipe em uma sequência operacional que pode ser executada de forma independente por uma única pessoa.

Tomemos como exemplo o comércio eletrônico transfronteiriço. No passado, o dono de uma loja precisava encontrar diariamente os produtos mais vendidos na Amazon, comparar preços no 1688, confirmar o estoque com os fornecedores e quebrar a cabeça para otimizar as descrições dos produtos. Uma pessoa só conseguia gerenciar, no máximo, três produtos.

Agora, após a integração do programa Wukong OPT, o "Radar de Seleção de Produtos" coleta regularmente os dados mais relevantes da Amazon e os insere em uma planilha de IA; assim que um produto campeão de vendas é identificado, a função "IA Encontra Produtos Similares" o conecta instantaneamente à cadeia de suprimentos nacional; habilidades de nível industrial auxiliam na confirmação direta de amostras, na geração de descrições de produtos e na produção de roteiros de vídeo. Da identificação de necessidades ao acompanhamento da cadeia de suprimentos, uma única pessoa pode realizar em uma tarde o que uma pequena equipe levaria uma semana para fazer.

O cenário do "negócio de uma pessoa só" é ainda mais comovente. Proprietários de oficinas mecânicas e salões de beleza de rua estão ocupados prestando serviços durante o dia e, à noite, precisam se esforçar para ficar acordados navegando no Xiaohongshu (uma plataforma de mídia social chinesa) para aprender com a concorrência e escrever textos publicitários. Agora, com múltiplas habilidades interligadas, a IA monitora automaticamente os produtos mais vendidos da concorrência, extrai modelos criativos reutilizáveis, gera automaticamente textos nativos e adaptados à internet, publica-os e pode até responder de forma inteligente a mensagens privadas de clientes 24 horas por dia, 7 dias por semana.

"Quando um lojista usa IA para gerenciar sua conta e obtém um resultado de qualidade superior ao das empresas terceirizadas contratadas por seus concorrentes, isso é mais do que apenas um aumento de eficiência. É uma reescrita da lógica de sobrevivência de pequenas e microlojas."

Essa é precisamente a lógica central da habilidade como produtividade: transformar a experiência tácita de especialistas do setor em capacidades padronizadas que todos possam utilizar . A habilidade não se trata apenas de melhorar a eficiência; trata-se de redistribuir capacidades, permitindo que pessoas sem formação profissional alcancem resultados de nível profissional.

A ambição maior por trás dessa lógica se reflete no mercado de recursos de IA lançado simultaneamente pela DingTalk.

Após o lançamento do padrão aberto Claude Skills pela Anthropic, gigantes como Microsoft, OpenAI e Cursor rapidamente seguiram o exemplo. Um consenso está se formando na indústria: a próxima etapa da competição não será sobre "qual modelo é mais forte", mas sim sobre "qual ecossistema de Skills é mais completo".

O mercado de recursos de IA da DingTalk abrange todo o sistema de Habilidades, Agentes e Serviços, conectando toda a cadeia, desde o desenvolvimento, revisão, listagem e distribuição até o gerenciamento.

As empresas podem consolidar as metodologias de funcionários seniores em competências privadas, eliminando completamente o problema da perda de talentos; milhares de funcionalidades prontas para uso na comunidade de código aberto também podem ser utilizadas a qualquer momento em uma arquitetura de segurança de nível empresarial.

Esta é a parte mais criativa do Wukong: construir a infraestrutura de produtividade para a era da IA ​​— a habilidade é a "moeda" que circula nessa infraestrutura. Quem dominar mais habilidades de alta qualidade controlará uma produtividade maior na era da IA.

Novo hardware de IA

Além do software, a DingTalk também lançou diversos produtos de hardware com inteligência artificial neste evento de lançamento.

DingTalk A1 Pro : Uma placa de gravação projetada para reuniões e ambientes de trabalho, que suporta captação de múltiplos microfones, transcrição em tempo real com IA, tradução e resumo, eliminando completamente o ciclo ineficiente de "ter que organizar a ata após a reunião".

Fones de ouvido Cleer H1 AI : Uma colaboração entre a DingTalk e a Cleer, este é o primeiro fone de ouvido com inteligência artificial profundamente integrado ao Wukong (o nome chinês para Rei Macaco). Ao usar os fones de ouvido, você pode conversar diretamente com o Wukong e dar comandos por voz sem precisar abrir a tela, alcançando o verdadeiro "você pensa, você recebe".

Mais notável é o hardware Real AI (Realbox) : ele apresenta um ambiente para 1 PC + 5 ambientes para celulares, suportando compartilhamento multiusuário e processamento simultâneo de tarefas. A implantação de um Realbox permite que uma empresa execute várias instâncias do Wukong para vários funcionários simultaneamente; a implantação de vários Realboxes possibilita a criação de um cluster de computação de IA, permitindo o processamento paralelo de tarefas e escalonamento elástico.

É evidente que o hardware de IA da DingTalk não compete com outros produtos similares no mercado; seu principal objetivo é integrar melhor os fluxos de trabalho de IA e se tornar uma plataforma de trabalho nativa de IA que combina software e hardware.

O OpenClaw funciona em um computador e faz o que um computador pode fazer; o Wukong, equipado com um cluster Realbox, declara oficialmente que o poder computacional da IA ​​pode circular dentro das empresas como água e eletricidade, na forma de infraestrutura .

Produtividade Organizacional na Era da IA

Ao assistir a essa coletiva de imprensa, lembrei-me de um ponto que Sam Altman mencionou em uma entrevista recente: "A primeira empresa bilionária da história a ser administrada por uma única pessoa está prestes a surgir."

Naquela época, lagostas ainda não eram um produto muito procurado, e o conceito de uma equipe de Treinamento Prático Opcional (OPT, na sigla em inglês) existia apenas na comunidade de IA. Ele não explicou quais ferramentas essa pessoa usaria, onde estaria localizada ou em qual setor trabalharia. Mas, depois de assistir a essa apresentação, essa afirmação se tornou mais concreta.

Essa pessoa provavelmente terá algo como Sun Wukong por perto. Nos últimos onze anos, o DingTalk tem ensinado as pessoas a usar ferramentas. O que Wukong quer fazer é, gradualmente, fazer com que as ferramentas realmente entendam as pessoas.

À medida que as ferramentas começam a compreender as pessoas, algo antes impossível torna-se possível: a produtividade organizacional pode, pela primeira vez, ser verdadeiramente digitalizada, integrada, distribuída e expandida . Quando a Skill transforma a experiência de especialistas do setor em uma moeda de acesso universal para o conhecimento de competências, e quando as plataformas nativas de IA se tornam o sistema operacional para que os indivíduos acessem as capacidades organizacionais, os limites do que um indivíduo ou organização pode fazer serão completamente redefinidos.

Sam Altman via a "empresa de uma pessoa só" como o objetivo final, e o que a Wukong pretende fazer é dar a mais pessoas comuns a oportunidade de trilhar esse caminho. Não é uma ferramenta projetada especificamente para gênios, mas sim um conjunto de infraestrutura de produtividade organizacional para a era da IA, destinado a todos que "querem fazer mais, mas enfrentam as limitações da energia de uma só pessoa".

As plataformas de trabalho nativas de IA estão se tornando a variável organizacional mais crítica da nossa época. Quem conseguir implementá-las primeiro entrará na era do superindivíduo.

Existia uma visão anterior de que a velocidade com que as fichas são queimadas determina a velocidade da evolução humana. E a versão 1.0 de Wukong aponta para a próxima versão da evolução humana e organizacional.

Por Li Chaofan

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.