Sete lançamentos consecutivos do modelo atualizam o nível SOTA, a China está dando à luz o Android da era da IA

setembro 26, 2025 gurinho

600 milhões de downloads, 170.000 modelos derivados, atendendo mais de 1 milhão de clientes.

Em 2025, quando a guerra da IA estava no auge, o modelo de IA de código aberto mais utilizado no mundo veio do Tongyi Big Model, do Alibaba. Não é exagero dizer que, quando desenvolvedores em todo o mundo precisam de um modelo gratuito, fácil de usar e sem restrições comerciais, ele se tornou a escolha padrão.

Na Conferência Yunqi de hoje, sete novos membros da grande família de modelos Tongyi foram revelados, abrangendo diversas áreas, como linguagem, visão, voz, multimodalidade e código. Da ecologia de código aberto a serviços comerciais, eles abrangem quase todos os principais elos das aplicações atuais de IA.

Esses sete modelos têm uma divisão de trabalho clara: o Qwen3-Max desempenha o papel de "teto", com trilhões de parâmetros comparados aos modelos mais potentes do mundo; o Qwen3-Next foca na "inclusão", alcançando o desempenho de um carro esportivo com o consumo de combustível de um sedã; o Qwen3-VL transforma esboços em código em segundos, o Qwen3-Omni é um assistente modal completo, o Qwen3-Coder é especializado em programação, o Wan2.5-preview realiza a criação de vídeos em nível de filme e o Tongyi Bailing Fun fornece centenas de serviços de som.

O CEO do Alibaba Group, Wu Yongming, anunciou diretamente dois grandes roteiros para o Alibaba Cloud: um é que a Tongyi Qianwen insiste no código aberto e pretende se tornar o "Android da era da IA"; o outro é construir o "computador da próxima geração" – a super nuvem de IA, para fornecer ao mundo uma rede de computação inteligente.

Olhando para trás, o Alibaba pode ter feito o julgamento mais importante desta era: as empresas de IA não devem apenas contar histórias sobre como superar a inteligência humana, mas também contar histórias sobre como permitir que todos tenham IA – e esta última pode ser mais imaginativa.

De modelos a ecossistemas, a gama completa de produtos da Tongyi Qianwen está aqui

Com sete modelos lançados em sequência, quais "novas cartas" específicas a família de modelos em grande escala Tongyi Qianwen revelou desta vez? Depois de analisar tudo, parece deslumbrante, mas o tema principal é bem claro: dois trunfos, além de uma mesa de pratos hardcore.

▲Vários modelos foram divulgados publicamente no Hugging Face na coletiva de imprensa

O primeiro trunfo é Qwen3-Max.

Este é o "teto" do Alibaba, com mais de um trilhão de parâmetros totais e 36 trilhões de tokens usados para pré-treinamento. Embora sua arquitetura dê continuidade ao design MoE da série Qwen3, a empresa fez melhorias significativas em seus métodos de treinamento.

Por exemplo, o balanceamento de carga global e o paralelismo de pipeline tornam o processo de treinamento mais estável e evitam flutuações anormais; a eficiência é 30% mais rápida que a geração anterior; também pode suportar textos longos de 1 milhão de palavras; até mesmo falhas comuns de hardware em clusters de grande escala podem reduzir a perda de tempo para um quinto do original.

Pontos principais:

O modelo principal, Qwen3-Max, melhora significativamente a programação e os recursos do agente inteligente, apresentando um desempenho excepcionalmente bom em vários benchmarks.

Qwen3-Max-Base: Enfatiza treinamento eficiente em larga escala, contexto longo e estabilidade excepcional.
Qwen3-Max-Instruct: Classificado entre os três primeiros do mundo no ranking de texto LMArena, superando o GPT-5-Chat. Obteve uma pontuação de 69,6 no teste de código verificado SWE-Bench e uma pontuação de 74,8 no benchmark de chamada de ferramenta de agente inteligente Tau2-Bench, superando o Claude Opus 4 e o DeepSeek-V3.1.
Qwen3-Max-Thinking (Pesado): Uma versão aprimorada de raciocínio que combina um interpretador de código com computação paralela. Alcança 100% de precisão em benchmarks de raciocínio matemático complexos, como AIME 25 e HMMT, demonstrando forte potencial de raciocínio. Ainda está em treinamento.

No geral, o Qwen3-Max elevou sua arquitetura de engenharia, eficiência de treinamento, contexto longo, recursos de raciocínio e tarefas de agentes inteligentes a níveis de liderança mundial. Seu desempenho em benchmarks de código e raciocínio demonstra que os modelos chineses estão realmente entrando em um estágio em que podem competir de frente com os concorrentes mais fortes.

O segundo trunfo é Qwen3-Next.

Se o Max é o rosto do Alibaba, o Next é o seu núcleo: ele realmente o torna acessível e viável para desenvolvedores e empresas.

Modelos grandes frequentemente enfrentam um "triângulo impossível" — alto desempenho, baixo custo e facilidade de implantação — e é difícil atingir todos os três. Modelos de ponta (como GPT-4/5) geralmente apresentam altos custos de inferência, tornando-se o maior obstáculo para a adoção da IA.

▲A eficiência de treinamento e inferência do Qwen3-Next foi bastante melhorada

A solução do Alibaba é usar o Qwen3-Max para ultrapassar o "teto" de desempenho e, em seguida, usar o Qwen3-Next para ultrapassar o "piso" de custo.

Por meio de inovações arquitetônicas de última geração, como MoE altamente esparso e atenção híbrida, ele atinge o desempenho de um modelo denso de 235B com apenas 3B de parâmetros de ativação. Isso equivale a atingir o desempenho de um carro esportivo com o consumo de combustível de um sedã. O resultado final é uma redução de 90% nos custos de treinamento e um aumento de dez vezes na eficiência de inferência de textos longos.

▲ Qwen3-Next adota uma nova arquitetura de modelo de última geração que combina atenção linear e atenção padrão. Songlin Yang, autor de Gated Delta Networks, retuitou Qwen

Essa capacidade sistemática transforma a visão de "todos podem usar IA" de um slogan em realidade, e é muito mais disruptiva para o setor do que simplesmente lançar um modelo de alto desempenho.

Uma mesa cheia de pratos deliciosos: ela cobre todo o trabalho que você possa imaginar

▲O modelo de linguagem visual Qwen3-VL supera o Gemini 2.5 Pro em vários testes de benchmark

Qwen3-VL: O modelo visual tornou-se open source, evoluindo do reconhecimento de imagens para o raciocínio e a execução. Ele pode operar interfaces de computador e dispositivos móveis, além de gerar código HTML/CSS diretamente a partir de um esboço. Para muitos gerentes de produto, isso significa que "o que você vê é o que você obtém" realmente se tornou uma realidade.
Qwen3-Omni: Uma plataforma multimodal capaz de processar texto, imagens, áudio e vídeo simultaneamente. Obteve o primeiro lugar em 32 testes de código aberto, dentre 36 benchmarks disponíveis publicamente, e alcançou desempenho de ponta em 22 deles. Também suporta conversas de voz em tempo real e até mesmo personalidades personalizáveis, como ter um assistente pessoal que fala mais de uma dúzia de idiomas.

▲ Em uma avaliação abrangente de desempenho, o Qwen3-Omni superou modelos de código fechado como Gemini-2.5-Pro, Seed-ASR e GPT-4o-Transcribe em vários testes.

Qwen3-Coder: Com um modelo de programação aprimorado, é mais rápido e seguro. Ele pode ajudar você diretamente a implantar um projeto completo e corrigir bugs facilmente. Para desenvolvedores, é mais como um "parceiro de programação em dupla" sempre disponível.
Wan2.5-preview: Um recurso incrível na direção do AIGC. Oferece recursos aprimorados para geração de vídeo e imagem, geração de imagem e edição de imagem. Fundamentalmente, ele alcança a geração de vídeo com qualidade cinematográfica com áudio e vídeo sincronizados pela primeira vez. Com velocidades de 5 a 10 segundos, resolução de 1080p e 24 quadros por segundo, este não é mais apenas um brinquedo; é uma ferramenta para criadores individuais criarem curtas-metragens.

Além disso, há a família Tongyi Bailing Fun de modelos de voz em larga escala, oferecendo centenas de vozes para cenários como atendimento ao cliente, transmissão ao vivo, comércio eletrônico e audiolivros. Há também o Qwen3Guard, um modelo de auditoria de segurança desenvolvido para segurança global de IA em tempo real com base no Qwen3, e o Qwen3-LiveTranslate-Flash, um modelo de tradução multimodal em tempo real.

Somando tudo isso, você verá que o Alibaba está enviando uma mensagem muito direta: Quer desempenho máximo? Temos o Max. Quer eficiência máxima? Temos o Next. Quer exploração multimodal? Temos o VL e o Omni. Quer produtividade em codificação e criação? Temos o Coder e o Wan…

▲Qwen3-Omni é uma nova geração de modelo omnimodal nativo de grande porte que pode processar perfeitamente diversos formulários de entrada, como texto, imagens, áudio e vídeo. Agora, ele pode ser ativado por meio de bate-papo por voz e vídeo no Qwen Chat.

Não se trata apenas de uma simples "pilha de novos produtos", mas de um ecossistema completo, com todos os tamanhos e modalidades. O Alibaba está entregando tudo aos usuários de uma só vez, dizendo a todas as empresas, indivíduos e desenvolvedores: não importa o que você esteja fazendo, a família de modelos Tongyi tem um bloco de construção que pode atender às suas necessidades.

Mas a importância deste "lançamento completo" não reside apenas no enriquecimento do produto. O lançamento simultâneo de sete modelos demonstra claramente que a família de modelos Tongyi Qianwen agora abrange todos os tamanhos e modalidades, e cada modelo alcançou desempenho de ponta nas avaliações mais populares.

É justamente essa base sólida que nos garantiu uma posição única no setor. Como disse o CEO do Alibaba Group, Wu Yongming, na coletiva de imprensa de hoje: "A Tongyi Qianwen é indiscutivelmente o modelo mais abrangente que permeia dispositivos de computação em todo o mundo".

No Hugging Face, a maior comunidade de modelos de IA de código aberto do mundo, uma busca pela palavra-chave "qwen" gera mais de 160.000 modelos relacionados, todos com milhões de downloads. Atualmente, o modelo da série Qwen tem o maior número de downloads, chegando a 7 milhões (Qwen2.5-3B-Instruct).

Até o momento, a Tongyi Qianwen tornou mais de 300 modelos de código aberto, abrangendo todas as modalidades e tamanhos. Esses modelos são os mais utilizados na China e os mais populares entre desenvolvedores em todo o mundo. Os modelos grandes da Tongyi foram baixados mais de 600 milhões de vezes em todo o mundo, com mais de 170.000 modelos derivados, tornando-se a maior matriz de modelos de código aberto do mundo.

Obviamente, nessa linha de modelos em larga escala ainda dominada por gigantes internacionais, uma família de modelos de código aberto da China está marcando presença à sua maneira e renovando o status histórico da IA doméstica.

Na segunda metade da era dos grandes modelos, Tongyi Qianwen pretende se tornar o Android da era da IA

Em 2019, quando o Alibaba testou um modelo de 10 trilhões de parâmetros em seu M6, o conceito de "grandes modelos" permaneceu amplamente acadêmico, distante da industrialização. Quatro anos depois, o lançamento oficial do Tongyi Qianwen marcou um ponto de virada.

Do Qwen-7B, 14B ao 72B, e então aos trilhões de parâmetros atuais, o caminho do Qwen não é complexo. É expandir continuamente a escala, otimizar, verificar e expandir uma família de modelos aos poucos.

Os parâmetros totais dos modelos Qwen2 e Qwen2.5 em 2024 e do Qwen3-Max lançado hoje excedem 1T, e 36T tokens são usados para pré-treinamento, melhorando ainda mais a codificação e os recursos do agente.

À medida que os grandes modelos entram em seus estágios finais, os modelos de código aberto estão se tornando uma tendência irreversível. A China se tornou quase o player mais importante no código aberto global, com Alibaba e DeepSeek desempenhando os papéis mais proeminentes.

Wu Yongming é franco sobre isso: "Na era do LLM, o valor criado pelos modelos de código aberto e os cenários em que eles podem penetrar será muito maior do que o dos modelos de código fechado."

As maiores empresas de modelos do mundo têm cada uma seu próprio foco: algumas atendem principalmente aos seus próprios ecossistemas, enquanto outras contribuem para negócios nas redes sociais e de publicidade. Algumas se concentram em ferramentas e crescimento de usuários, enquanto outras enfatizam a integração modal completa e a integração de buscas. O Alibaba, por outro lado, aspira se tornar o "Android da era da IA".

O sucesso do Android não está em ser mais forte e perfeito que o iOS, mas em sua capacidade de se adaptar a uma ampla gama de dispositivos, desde telefones antigos que custam algumas centenas de yuans até telas dobráveis que custam dezenas de milhares de yuans, permitindo que o mercado de smartphones realmente floresça.

A lógica do Qwen é exatamente a mesma. Do 0.5B ao Qwen3-Max "em escala real" com trilhões de parâmetros, do Qwen3-Coder para escrever código ao Qwen3-VL para "codificar olhando imagens", aos dispositivos Tongyi Wanxiang e Tongyi Bailing que podem ouvir e falar com áudio e vídeo sincronizados, e até mesmo o Qwen3-Omni que permite conversas de voz em tempo real como uma pessoa real, o Alibaba tem quase todas as ferramentas que um desenvolvedor poderia imaginar.

Por trás disso há uma mudança de pensamento: o Alibaba não decide mais por você "o que usar", mas devolve ao mercado o direito de escolha, definição e até mesmo o controle final de custos.

Qwen desempenha o papel mais difícil e cansativo, mas insubstituível – o sistema Android na era da IA, fornecendo a "água, eletricidade e gás" básicos para a implementação de aplicativos e cenários de IA.

De fato, mais de um milhão de empresas já acessaram os serviços de modelo em larga escala da Tongyi por meio do Alibaba Cloud. Assim como o acesso à água e à eletricidade, a IA está sendo considerada a forma mais fundamental de produtividade. Apesar dos repetidos atrasos, a implementação da IA da Apple na China foi quase certamente confirmada, em parceria com a Qwen. Esta é a primeira vez que um modelo chinês em larga escala entra no mercado do iPhone.

Na Conferência Yunqi de hoje, Wu Yongming também anunciou que o Alibaba investirá mais de 380 bilhões de yuans nos próximos três anos em infraestrutura de hardware de nuvem e IA, com planos para investimentos ainda maiores. De acordo com os planos de longo prazo, em preparação para a chegada da era ASI, o consumo global de energia do data center do Alibaba Cloud deverá aumentar dez vezes até 2032, em comparação com 2022, o primeiro ano da GenAI.

Este também é o "Modelo como Serviço" (MaaS) que o Alibaba Cloud vem seguindo desde 2022. Ele posiciona grandes modelos como o elemento central da produtividade e conta com o poder de computação e a infraestrutura do Alibaba Cloud para fornecer às empresas recursos de IA de alto desempenho e baixo custo.

Quando uma plataforma tenta diminuir o limite de inovação para toda a sociedade, o que ela pode apoiar não é apenas seu próprio valor comercial.

Para desenvolvedores e empresas que lutam com a questão de "qual modelo usar", o surgimento de um sistema "IA Android" aberto, barato e fácil de usar é como voltar à Era dos Descobrimentos, quando alguém construiu um porto para você e também tornou todas as cartas náuticas do mundo abertas ao público.

Parece não haver outra escolha senão zarpar.

Autores: Li Chaofan, Zhang Zihao, Mo Chongyu

#Bem-vindo a seguir a conta pública oficial do WeChat do iFaner: iFaner (ID do WeChat: ifanr), onde mais conteúdo interessante será apresentado a você o mais breve possível.

iFanr | Link original · Ver comentários · Sina Weibo