100 trilhões de tokens revelam como usuários globais utilizam IA: metade do poder computacional é usado em lugares “indizíveis”.

O maior registro de comportamento do usuário já feito na área de IA acaba de ser divulgado.

Este é um relatório divulgado pela OpenRouter, uma plataforma global de agregação de modelos, em conjunto com a a16z, uma importante empresa de capital de risco do Vale do Silício. Ele se baseia em 100 trilhões de chamadas de API reais em todo o mundo, abrangendo mais de 300 modelos de IA, mais de 60 fornecedores e mais de 50% de usuários fora dos EUA .

Podemos ver, por meio disso, como os humanos estão realmente usando a IA, especialmente naquelas conversas que não aparecerão em processos oficiais ou serão registradas em documentos técnicos.

A APPSO descobriu três conclusões bastante contraintuitivas a partir disso:

1. As necessidades mais genuínas e fundamentais da humanidade não são a produtividade, mas sim os "hormônios" e as "brincadeiras de casinha". Mais de 50% do poder computacional dos modelos de código aberto é usado para jogos de RPG, encontros virtuais e conteúdo impróprio para menores. Escrever código? Isso é secundário.

2. Usuários de alto padrão nem sequer olham para o preço, enquanto modelos tão baratos que são praticamente gratuitos tendem a fracassar ainda mais rápido. Modelos que abordam os problemas dos usuários desde o início têm maior probabilidade de fidelizá-los.

3. Os modelos chineses romperam as defesas em apenas um ano. De 1,2% para 30%, os modelos desenvolvidos internamente, representados pelo DeepSeek e pelo Qwen, tornaram-se os reis do código aberto.

É importante ressaltar que este relatório inevitavelmente contém "viés".

Os usuários do OpenRouter são principalmente desenvolvedores individuais, pequenas e médias empresas e entusiastas de código aberto, e não empresas da lista Fortune 500. Grandes empresas que gastam milhões de dólares mensalmente em orçamentos de IA para Azure e AWS não estão incluídas nesses dados. Portanto:

  • A proporção de modelos chineses será ampliada (desenvolvedores de pequeno e médio porte estão mais dispostos a experimentar soluções de código aberto e de baixo custo).
  • A participação de modelos de código aberto será maior (os usuários corporativos preferem a estabilidade das APIs de código fechado).
  • Jogos de interpretação de papéis e outros cenários "voltados para o entretenimento" terão uma taxa de utilização significativamente maior (grandes empresas não usarão APIs públicas para isso).
  • O uso real de implantações híbridas em nível empresarial não é visível (todas utilizam servidores privados e o serviço Azure OpenAI).

Mas, olhando para trás, é exatamente aí que reside o valor deste relatório.

Enquanto todos nas conferências de imprensa alardeiam como a IA transformará a produtividade, fica claro quem tem nadado nu, quem está levando todos os despojos e quem está silenciosamente dominando essas áreas indizíveis.

De 1% a 30%, os modelos chineses abriram brechas no império da OpenAI.

Se considerarmos o mercado de IA como um mapa-múndi, antes de 2024, ele era um império de código fechado pertencente à OpenAI e à Anthropic. Elas construíram muros altos em torno das APIs, cobravam taxas e definiam as regras.

Mas o muro desabou.

Analisando este gráfico de distribuição de uso, a utilização de tokens no modelo de código aberto (OSS) aumentou para um terço do total, e esse número continua crescendo a um ritmo alarmante.

O verão de 2024 foi um momento decisivo.

Antes disso, o mercado estava estagnado. A série GPT da OpenAI e o Claude da Anthropic dominavam o mercado, com os modelos de código aberto desempenhando apenas um papel secundário.

Na sequência, com o rápido lançamento do Llama 3.3 70B, DeepSeek V3 e Qwen 3 Coder, o cenário mudou drasticamente. O volume de chamadas à API, antes dominante, começou a sofrer uma queda acentuada.

A ascensão do modelo chinês precisa ser discutida aqui, pois tem sido a narrativa mais agressiva do último ano.

Os dados mostram:

  • Início de 2024: A participação da China no uso global de modelos de código aberto era de apenas 1,2%, praticamente insignificante.
  • Até o final de 2025: Esse número deverá subir para 30%, podendo até atingir o pico em algumas semanas.

De 1,2% a 30%, trata-se de uma batalha de cerco de baixo para cima.

DeepSeek mantém firmemente a primeira posição no ranking de código aberto, com um total de 14,37 trilhões de tokens utilizados. Embora sua posição dominante esteja sendo diluída, sua escala permanece impressionante. Qwen vem logo atrás, em segundo lugar, com 5,59 trilhões de tokens, e seu desempenho na área de programação é extremamente forte, rivalizando diretamente com Claude.

Mais importante ainda é o ritmo. Os modelos chineses são lançados com extrema frequência. O DeepSeek lança grandes atualizações quase a cada trimestre, e o Qwen itera ainda mais rápido. Essa "abordagem de alta frequência" deixa os gigantes do Vale do Silício lutando para acompanhar: eles mal lançaram um novo modelo quando seus concorrentes já lançaram três variantes.

Estourando a bolha da IA: três verdades ignoradas

Agora, vamos desmistificar essas ideias preconcebidas e ver para que a IA está sendo realmente usada no mundo real.

Verdade nº 1: "Os modelos pequenos estão mortos, os modelos médios estão em ascensão."

O mercado está demonstrando sua insatisfação com a prática, abandonando aqueles micromodelos "rápidos e estúpidos".

Os dados mostram que a participação de mercado de modelos com menos de 15 bytes de parâmetros está despencando. Os usuários estão descobrindo que a velocidade é inútil se a IA for tão burra quanto um disco riscado; é melhor nem usá-la.

Os modelos de tamanho médio (parâmetros de 15B a 70B) tornaram-se os novos favoritos. Esse mercado foi inclusive criado pelo Qwen2.5 Coder 32B em novembro de 2024. Antes disso, essa faixa de parâmetros estava praticamente vazia; desde então, modelos como o Mistral Small 3 e o GPT-OSS 20B surgiram rapidamente, formando um novo campo de batalha.

Os modelos que não são baratos nem suficientemente potentes estão perdendo participação de mercado. É preciso escolher entre o máximo em potência ou o máximo em custo-benefício.

Verdade nº 2: Não se trata de programação, mas sim de brincar.

Embora vejamos frequentemente notícias sobre como a IA melhora a produtividade, mais de 50% do tráfego relacionado ao uso de modelos de código aberto se destina a "roleplay" (jogos de interpretação de papéis) .

Para dizer de forma mais direta:

Mais da metade da capacidade computacional de IA de código aberto é usada para esses fins:

  • Conversa virtual com um(a) amante ("Converse comigo, lembre-se das minhas preferências")
  • Jogo de interpretação de papéis ("Você agora é uma princesa elfa…")
  • Geração de romance interativo ("Continue a história e adicione mais detalhes")
  • Criação de conteúdo voltado para adultos (classificado como "Adulto" no relatório, representando 15,4%)

Este é o resultado da análise de centenas de milhões de solicitações reais usando a API de Classificação de Linguagem Natural do Google Cloud. Uma solicitação é marcada quando a IA detecta que ela pertence a /Adult ou /Arts & Entertainment/Roleplaying Games.

Isso significa que, para um grande número de usuários finais, a IA é, antes de tudo, um "objeto de projeção emocional" e somente em segundo lugar uma ferramenta .

Entretanto, os serviços de streaming e os gigantes do Vale do Silício, por razões de segurança da marca, evitaram deliberadamente ou até mesmo suprimiram essa demanda. Mas isso criou um enorme "vácuo entre oferta e demanda". O desejo dos usuários por interação emocional, narrativas envolventes e até mesmo conteúdo impróprio para menores (NSFW, na sigla em inglês) foi suprimido da visão dominante e acabou explodindo na comunidade de código aberto.

A programação é o segundo maior caso de uso, representando de 15 a 20%. Isso mesmo, escrever código, tão alardeado pela mídia, ocupa apenas o segundo lugar no mundo real.

Afinal, qual é a verdade?

Pare de fingir. As duas necessidades mais genuínas e fundamentais da humanidade são hormônios e código. Os primeiros proporcionam companhia e emoção, enquanto o segundo nos permite ganhar dinheiro. Todas as outras formas de "compartilhamento de conhecimento", "resumos de documentos" e "tutoria educacional" juntas representam menos de uma fração dessas duas.

Isso também explica por que os modelos de código aberto cresceram tão rapidamente, já que normalmente estão sujeitos a menos censura, permitindo aos usuários mais liberdade para personalizar personagens e enredos, tornando-os ideais para interações com nuances emocionais.

Verdade nº 3: Usuários do DeepSeek obcecados por entretenimento

Se analisarmos os dados do DeepSeek separadamente, encontraremos uma distribuição ainda mais extrema:

– Roleplay + Bate-papo casual: Aproximadamente 67%
– Programação: apenas uma pequena parte

Neste relatório, o DeepSeek é retratado quase mais como uma ferramenta de entretenimento voltada para o consumidor do que como uma ferramenta de produtividade. Seus usuários não estão escrevendo código; eles estão "namorando" IA.

Isso contrasta fortemente com Claude.

Só há uma chance; o vencedor leva tudo.

Por que alguns modelos têm apenas um momento passageiro de popularidade, enquanto outros grudam nos usuários como cola?

O relatório apresenta um conceito: o efeito "sapatinho de cristal" da Cinderela .

Definição: Quando um novo modelo é lançado, se ele resolve perfeitamente um problema antigo dos usuários (como o sapatinho de cristal que serviu perfeitamente nos pés da Cinderela), esses usuários se tornarão "fãs incondicionais" do modelo (usuários básicos fidelizados) e terão dificuldade em migrar, não importa quantos novos modelos sejam lançados no futuro.

É importante ressaltar que esta é uma oportunidade única na vida. Se um avanço tecnológico não for alcançado durante o lançamento inicial (janela de oportunidade) para fidelizar esses usuários principais, não importa o quanto você se esforce depois, a taxa de retenção será extremamente baixa.

Por que?

Porque os usuários já criaram um fluxo de trabalho completo em torno desse modelo:

– Os desenvolvedores integraram o Claude ao processo de CI/CD.
Criadores de conteúdo salvaram dezenas de versões da persona do DeepSeek.
Os custos de mudança não são apenas técnicos, mas também cognitivos e habituais.

Perfil do Vencedor: "Efeito Bumerangue" da DeepSeek

A curva de retenção do DeepSeek é muito estranha:

Teste do usuário → Cancelamento (para experimentar outros modelos) → Depois de um tempo, eles voltam reclamando.

Isso é conhecido como o "efeito bumerangue". Os dados mostram que a base de usuários do DeepSeek R1 em abril de 2025 apresentou um aumento significativo na taxa de retenção no terceiro mês.

Por que eles voltaram?

Porque é "realmente bom". Depois de testar todos os modelos disponíveis no mercado, descobri que o DeepSeek ainda oferece a melhor relação custo-benefício.

  • Gratuito ou a preços muito baixos
  • Habilidade suficiente para interpretar papéis
  • Sem censura de conteúdo irritante

Um retrato dos perdedores: A tragédia da Llama 4 Mavericks

Em contrapartida, modelos como o Llama 4 Maverick e o Gemini 2.0 Flash apresentam taxas de retenção extremamente baixas.

Tem sido uma espiral descendente desde a primeira semana, sem volta possível.

Por quê? Porque chegaram tarde demais e não tinham nenhum recurso especial. Quando foram lançados, os usuários já haviam encontrado seus "sapatos de cristal", e os novos modelos só poderiam se tornar "opções de reserva".

No mercado de modelos de IA, chegar atrasado significa marginalização permanente.

Os designs dos personagens de cada IA

Nesta guerra, ninguém pode vencer tudo; todos estão ou sofrendo ou se divertindo ao som de sua própria música de fundo. Vamos atribuir a cada jogador o rótulo mais preciso:

Claude (Anthropic): O "Deus" dos Engenheiros Heterossexuais

Personagem: Um cara da área de ciências e engenharia que se destaca em uma área, mas carece de habilidades românticas; ele só sabe programar.

Os dados não mentem; Claude detém há muito tempo mais de 60% do mercado de programação. Embora essa participação tenha diminuído ligeiramente nos últimos tempos, ela continua sendo uma barreira intransponível quando se trata de escrever código.

Perfil do usuário:
Mais de 80% do tráfego do Claude está relacionado a tecnologia e código.
– Quase ninguém o usa para conversas informais ou para jogos de interpretação de papéis.

Claude é como o melhor aluno da turma — você só o procura durante as provas; vocês nunca saem juntos em outras ocasiões.

OpenAI: De "O Único Deus" a "O Velho Rei Medíocre"

Perfil do Personagem: Antigo Soberano, Agora uma Ferramenta

As mudanças na participação de mercado da OpenAI foram extremamente drásticas:
– Início de 2024: Consultas relacionadas à ciência representaram mais de 50%
– Até o final de 2025: A proporção de cursos relacionados à ciência cairá para menos de 15%.

Está se transformando de um "deus único e inigualável" em uma "caixa de ferramentas que pode fazer tudo, mas não é boa em nada". Embora o GPT-40 Mini ainda apresente uma alta taxa de retenção, ele não é mais a única opção em mercados verticais.

O principal problema é que a empresa ficou presa ao próprio sucesso. O ChatGPT se tornou uma marca de mercado de massa, mas isso também fez com que perdesse sua vantagem competitiva no campo profissional.

Google (Gêmeos): A Ansiedade dos Generalistas

Características da personalidade: Quer tudo, mas não se destaca em nada.

O Google é como um generalista perplexo. Está presente no direito, na ciência, na tradução e em perguntas e respostas de conhecimento geral, mas:
– Apenas 15% de participação de mercado na área de programação.
– Quase inexistente no campo dos jogos de RPG

Mas, em um mercado cada vez mais verticalizado, o generalismo significa mediocridade.

DeepSeek: A Vitória dos Bárbaros

Personagem: Um disruptor que não segue as regras, o rei do entretenimento de baixo orçamento.

A DeepSeek conquistou um nicho de mercado com sua excepcional relação custo-benefício, provando que, mesmo sem o raciocínio lógico mais sólido, é possível dominar o mercado sendo "divertido" e "gratuito".

Dados principais:
– Utilização total: 14,37 trilhões de tokens (primeiro em código aberto)
– 67% do tráfego é de entretenimento e jogos de interpretação de papéis.
– O efeito bumerangue é óbvio; os usuários voltarão mesmo depois de experimentarem outras coisas.

O seu sucesso prova uma coisa: no mercado de consumo, "bom o suficiente" + "barato o suficiente" + "sem restrições" podem ganhar tudo.

xAI (Grok): A abordagem "Punho Aleatório" de Musk

Personagem: Um ataque surpresa da multidão, conquistando participação de mercado ao oferecer serviços gratuitos.

Os dados do Grok são muito interessantes:
– No início, 80% dos usuários eram programadores (o Grok Code Fast é otimizado para programação).
– Após a promoção gratuita, um grande número de usuários comuns repentinamente invadiu a plataforma, tornando instantaneamente o perfil do usuário mais complexo.

Oferecer serviços gratuitos pode atrair tráfego, mas tráfego ≠ fidelidade. Assim que você começar a cobrar, esses usuários irão embora imediatamente.

Por fim, vamos compreender este mundo com uma única imagem.

O atual mercado de modelos de grande porte formou claramente uma estrutura de quatro vertentes:

Em primeiro lugar, temos o grupo dos "gigantes da eficiência", representados pelo DeepSeek e pelo Gemini Flash. Sua principal vantagem reside na alta relação custo-benefício, sendo "baratos e abundantes", projetados especificamente para cenários de alto volume. São especialmente adequados para tarefas repetitivas, "sujas e cansativas" que não exigem raciocínio lógico complexo, tornando-os a primeira escolha para quem busca um equilíbrio entre eficiência e custo.

Em segundo lugar, há a categoria de "especialistas de ponta", com Claude 3.7 e GPT-4 sendo as referências nesse campo. Apesar dos preços elevados, eles conquistaram a preferência de usuários corporativos devido à sua precisão excepcional e capacidade de lidar com tarefas complexas.

Ao mesmo tempo, o espaço vital do segmento de "cauda longa" está diminuindo, e um grande número de modelos pequenos está sendo gradualmente eliminado do mercado devido à falta de vantagens diferenciadas e barreiras tecnológicas.

Além disso, o grupo de empresas "disruptivas", com modelos chineses em seu núcleo, está em rápida ascensão. Com suas frequentes atualizações tecnológicas, estratégias de preços acessíveis e profunda capacidade de localização, sua participação de mercado continua a se expandir, tornando-se uma força fundamental na reformulação do cenário da indústria.

A tendência oculta por trás de 100 trilhões de tokens

Como observadores, a APPSO identificou algumas tendências neste relatório que podem definir o futuro cenário competitivo da IA:

1. Um ecossistema multimodelos é a norma; a adoração a um único modelo é patológica . Os desenvolvedores construirão como blocos, usando Claude para escrever código, DeepSeek para aprimorar a documentação e Llama para implantação local. Lealdade? Não existe.

2. Os agentes já conquistaram metade do mercado. Os modelos de raciocínio agora representam mais de 50% do mercado. Não queremos mais que a IA apenas forneça uma resposta; queremos que a IA forneça um "processo de pensamento". Raciocínio em várias etapas, chamadas de ferramentas e contextos longos são os novos campos de batalha.

3. Retenção > Crescimento <br /> Além da taxa de retenção inicial de usuários, outras métricas de crescimento são métricas de vaidade.

4. A especialização em uma área vertical é mais valiosa do que a versatilidade.
Claude se destaca em programação, enquanto DeepSeek reina supremo no entretenimento. Um modelo que tenta fazer tudo acaba não fazendo nada bem.

5. O preço não é a única variável, mas a "facilidade de uso" é sempre um fator determinante . Os dados mostram uma correlação muito fraca entre preço e uso. Usuários de dispositivos de ponta são insensíveis ao preço, enquanto usuários de dispositivos de baixo custo reconhecem apenas alguns poucos aparelhos com boa relação custo-benefício. Modelos medianos, que ficam no meio termo, são os que apresentam pior desempenho.

6. A ofensiva do modelo chinês está apenas começando . Levou apenas um ano para passar de 1,2% para 30%. Tendo estabelecido uma posição sólida, o que vem a seguir? Irá definir as regras ou será subjugado por elas? Essa será a história mais importante em 2026.

O mundo da IA ​​não se define pela visão apresentada em um evento de lançamento de produto, mas sim pelos trilhões de tokens que os usuários enviam diariamente.

Entre esses tokens, algumas pessoas estão escrevendo código para mudar o mundo, enquanto outras estão dando boa noite a namoradas virtuais; código racional e conversas emocionais coexistem harmoniosamente.

Talvez devamos admitir que o desenvolvimento da IA ​​também é uma extensão dos desejos humanos.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

ifanr | Link original · Ver comentários · Sina Weibo