Queimar 120 trilhões de tokens por dia é o mais recente Versalhes no mundo da IA.

Hoje, a Volcano Engine divulgou dados mostrando que o uso diário de tokens no modelo Doubao Large ultrapassou 120 trilhões.
Há três meses, esse número era de 60 trilhões. Quando o Modelo Doubao Big foi lançado pela primeira vez, em maio de 2024, era apenas um milésimo disso.
Qual é o conceito de 120 trilhões de tokens?
Com base em um cálculo aproximado, utilizando o preço de entrada de cerca de 2 a 4 yuans por milhão de tokens para os principais modelos domésticos em março, isso significa que entre 300 e 500 milhões de yuans são consumidos por GPUs todos os dias. Ao longo de um ano, isso equivale a centenas de bilhões de yuans em gastos, o que corresponde a consumir toda a receita anual da NetEase (a receita líquida da NetEase para todo o ano de 2025 foi de 112,6 bilhões de yuans). E esse é apenas o volume de uma empresa, uma plataforma de modelo e um único dia.

Esse número se torna mais interessante quando analisado em um contexto mais amplo.
Em 23 de março, o Fórum de Desenvolvimento da China 2026 revelou que, em março deste ano, o uso médio diário de tokens na China ultrapassou 140 trilhões, um aumento de mais de 1.000 vezes em comparação com os 100 bilhões registrados no início de 2024. No mesmo mês, o uso semanal de tokens para modelos de IA em larga escala na China superou o dos Estados Unidos por três semanas consecutivas. Dados da OpenRouter mostram que, na terceira semana de março, o uso global total de tokens para modelos de IA em larga escala atingiu 20,4 trilhões, com a China respondendo por 7,359 trilhões, representando 36% da participação global.
A LatePost já havia relatado outro detalhe: apenas três empresas no mundo têm um consumo diário de tokens superior a 100 trilhões: OpenAI, Google e ByteDance.
O que é ainda mais intrigante é que o consumo de tokens da OpenAI e do Google vem do mercado global, enquanto o da ByteDance vem principalmente da China. Uma plataforma focada no mercado doméstico já alcançou um volume de transações com tokens comparável ao de duas gigantes globais. Sua presença internacional continua crescendo.
O presidente da Volcano Engine, Tan Dai, explicou os dois motores por trás do crescimento: a explosão da criação de vídeos com IA e a popularização acelerada de agentes inteligentes com IA.
Ambas as coisas foram transmitidas de pessoa para pessoa simultaneamente nos últimos três meses.

▲ Tan Dai, Presidente da Volcano Engine
As lagostas chegaram, e a forma como as fichas são queimadas mudou.
Após o sucesso do OpenClaw, todos falavam sobre Agentes. Um "lobster" fez com que toda a indústria percebesse que a lógica de consumo de tokens na era dos Agentes é completamente diferente daquela na era dos chats.
Antes, quando você interagia com um modelo grande, era uma simples sessão de perguntas e respostas, e algumas centenas de tokens eram suficientes. Agora, um agente precisa pensar, planejar, ajustar ferramentas, verificar resultados e se corrigir quando erros são cometidos. Executar uma tarefa complexa consome dezenas ou até centenas de vezes mais tokens do que uma conversa normal.
O ArkClaw da Volcano Engine é um microcosmo disso. Ele se conecta ao Lark em segundos e também ao WeChat, DingTalk e Weibo, além de aprimorar seu armazenamento em nuvem para colaboração completa na nuvem. Por trás de cada função "automática" está a circulação de tokens em alta velocidade.
Tan chegou a uma conclusão: a chave para que as empresas façam bom uso de agentes reside em três fatores: modelos, segurança e habilidades.

O modelo é o cérebro do agente. O Doubao Big Model 2.0, lançado em fevereiro deste ano, já alcançou o topo do ranking global e é o número um na China em compreensão visual. A segurança é primordial; o Volcano Engine acaba de obter dupla certificação da Academia Chinesa de Tecnologia da Informação e Comunicação (CAICT): "Certificação de Confiabilidade do Produto Agente Inteligente Assistente" e "Certificação de Eficácia do Produto de Proteção de Segurança", tornando-o o único do seu tipo na China.
Mas um cérebro inteligente e uma cela segura não bastam; um agente precisa de mãos e pés para realizar suas tarefas. A abrangência do ecossistema de Habilidades determina diretamente o limite das capacidades de um agente.
Isso também serve de pano de fundo para outro grande anúncio naquele dia: o fundador do OpenClaw, Peter Steinberger, e a Volcano Engine anunciaram conjuntamente que o site espelho chinês do ClawHub (mirror-cn.clawhub.com), construído em conjunto pelas duas partes, entrou oficialmente em operação.
Anteriormente, os desenvolvedores locais que utilizavam Skills no ClawHub frequentemente enfrentavam problemas de acesso lento e instável. O site espelho resolve esse problema: o acesso de alta frequência não é mais lento e as atualizações das Skills podem ser sincronizadas em tempo hábil. Peter Steinberger chegou a usar uma "lagosta" para gerar um vídeo para anunciar a novidade no evento de lançamento.
Na plataforma Volcano Engine, o número de clientes corporativos com uso cumulativo de tokens superior a um trilhão cresceu de 100 no final do ano passado para 140. Em apenas três meses, mais 40 membros entraram para o "Clube do Trilhão".
Seedance 2.0 Beta Aberto: Geração de Vídeo de Nível Empresarial Agora com uma Base Segura
No mesmo dia, a Volcano Engine também anunciou que a API do Seedance 2.0 foi oficialmente aberta para testes beta públicos para usuários corporativos.
O Seedance 2.0 é o modelo de última geração (SOTA) global na área de geração de vídeo, mas o que o torna verdadeiramente útil para empresas vai além da qualidade do conteúdo gerado. O Volcano Engine desenvolveu um conjunto abrangente de padrões de segurança de imagem e direitos autorais que cobrem todo o processo, desde a verificação de conformidade dos materiais de entrada até a proteção dos direitos de imagem durante a geração e, finalmente, a interceptação de riscos de violação de direitos autorais no conteúdo de saída. Problemas como deepfakes e violação de direitos autorais, que tiram o sono dos departamentos jurídicos corporativos, são interceptados no nível do modelo.
Esse mecanismo de segurança abrange todas as modalidades envolvidas na geração de vídeo e todas as etapas antes e depois da criação. Simplificando, a Volcano Engine optou por reforçar a segurança quando o modelo estava no auge de sua popularidade, antes de entregar a chave da API para empresas.
Para as empresas, isso resolve um problema muito real: a disposição para usar essas tecnologias. Publicidade de marcas, vídeos de e-commerce e materiais de marketing são extremamente sensíveis a direitos autorais e de imagem. Sem medidas de segurança robustas, nem mesmo as tecnologias mais poderosas incentivarão as empresas a adotá-las em larga escala.
Tan Dai descreveu dois caminhos para a construção de agentes empresariais: ágil e estável. Agentes ágeis, como o ArkClaw, servem como um "campo de testes de inovação" para os funcionários, permitindo que cada profissional de RH se torne um profissional de RH melhor e cada analista se torne um analista melhor. Agentes estáveis, por outro lado, processam e escalam as melhores práticas validadas, incorporando-as em cenários como transações contratuais e gestão de produção — cenários onde não há espaço para ilusões.
Os dois caminhos não são mutuamente exclusivos, mas sim formam um ciclo virtuoso: a inovação individual é desencadeada no ArkClaw, precipita-se no HiAgent para se tornar capacidades organizacionais e, em seguida, retroalimenta todos os funcionários da linha de frente por meio de Skills e APIs.
Por trás da marca de 120 trilhões de yuans, a ascensão das fábricas de tokens.
Recentemente, Jensen Huang deu o tom ao prever que a demanda global por computação ultrapassará US$ 1 trilhão até 2027. Ele afirmou que os tokens são a moeda base da nova era e que os data centers deixarão de ser depósitos para armazenar arquivos e se tornarão fábricas de produção de tokens.
A próxima pergunta que deve ser feita é: quem está pagando por esses tokens?
O volume cumulativo de chamadas de 140 empresas na plataforma Volcano Engine ultrapassou um trilhão. De outra perspectiva, a estrutura de custos da IA está mudando de "comprar o modelo uma vez" para "pagar por uso". E o preço dos tokens está disparando.
Ao longo do último mês, as notícias sobre aumentos de preços têm surgido como um efeito dominó.
A Zhipu ajustou seus preços duas vezes em um mês, com o GLM-5-Turbo aumentando 20% e o GLM Coding Plan subindo 30% na China e mais de 100% no exterior. No primeiro trimestre, o preço geral da API aumentou 83% em comparação com a geração anterior. O CEO da Zhipu, Zhang Peng, fez uma declaração importante na conferência de resultados: "Mesmo com um aumento de 83%, o volume de chamadas ainda cresceu 400%, indicando que a oferta não consegue atender à demanda."
Além disso, no mesmo dia, 18 de março, a Alibaba Cloud e a Baidu AI Cloud anunciaram simultaneamente aumentos de preços, elevando os valores de seus produtos de computação de IA em 5% a 30% e o armazenamento em 30%. A Tencent Cloud foi ainda mais longe, ajustando sua estratégia de faturamento para sua plataforma de desenvolvimento de agentes inteligentes em 13 de março, com alguns modelos apresentando aumentos de preço superiores a quatro vezes.

Olhando para um período anterior, a Amazon AWS aumentou o preço dos blocos de capacidade de aprendizado de máquina em 15% em janeiro, enquanto o Google Cloud também aumentou discretamente o preço de seu serviço de transferência de dados durante o mesmo período.
O fato de as três maiores empresas de computação em nuvem nacionais e as duas maiores empresas internacionais terem aumentado os preços no mesmo trimestre não é coincidência. Alguém calculou que o consumo médio diário de tokens dos usuários do OpenClaw é de 20 a 50 vezes maior do que o dos usuários de chats tradicionais.
Quando um grande número de usuários executa os agentes simultaneamente, a taxa de crescimento da demanda supera em muito a da oferta — a capacidade de produção de GPUs, a eletricidade e os data centers exigem uma base sólida. Jensen Huang afirma que os tokens são uma forma de moeda básica. Mas a moeda pode ser armazenada, acumulada e valorizada. Os tokens não. Os tokens são consumidos no momento em que são produzidos, assim como a eletricidade.
O termo "eletricidade" nunca foi apenas uma questão técnica. Quem controla a geração e a transmissão de energia detém o poder de precificação. As redes elétricas precisam de regulamentação e as telecomunicações exigem licenciamento. E quanto aos tokens? Ninguém respondeu a essa pergunta ainda, mas todas as empresas querem ser a resposta.
#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

