Experimentei o modelo de código aberto mais poderoso do mundo, Qwen 3, no Tongyi APP, o que mudou minhas expectativas em relação à IA doméstica

abril 30, 2025 gurinho

Quando acordei, o trono do código aberto global mudou, não o R2. A boa notícia é que os usuários chineses ainda são os maiores beneficiários.

Esta manhã, o Alibaba abriu o código-fonte de uma nova geração do modelo autodesenvolvido Qwen 3 (Qianwen 3). Seu desempenho superou os modelos DeepSeek-R1 e OpenAI o1 em todos os aspectos, e liderou o trono global do modelo de código aberto assim que ficou online.

Qianwen 3 também é o primeiro "modelo de raciocínio híbrido" da China, que tem as reações do Flash e o pensamento cuidadoso de Sherlock Holmes. É orientado por dual-core e possui capacidades de raciocínio bastante aprimoradas, acompanhamento de instruções, chamada de ferramentas, codificação e recursos multilíngues.

Atualmente, você pode experimentar diretamente o modelo de código aberto mais forte do mundo no Tongyi APP e na versão web do Tongyi tongyi.com.

A APPSO também experimentou o Tongyi APP pela primeira vez, e a primeira sensação da experiência foi: não é apenas rápido e preciso, mas também tem um senso de confiança há muito perdido.

IA doméstica pode finalmente lutar contra “Retarded Bar” por 300 rodadas

Deve-se notar que o atual APP Tongyi está equipado com o modelo Qwen3-235B-A22B por padrão.

Este é um modelo principal com foco no desempenho de "inferência híbrida". Se você tiver necessidades diferentes, também poderá alternar o seletor de modelo para Qwen 3-32B, que é estável, eficiente e adequado para implantação empresarial, ou QWQ-32B, que suporta pensamento profundo de alto desempenho.

Vamos começar com uma questão de raciocínio clássica para ver se o APP Tongyi atualmente equipado com Qwen3-235B-A22B pode responder a algumas das “doenças difíceis” que encontramos antes.

Havia um rei que queria casar sua princesa com o mais sábio dos três príncipes. O rei fez um teste absolutamente justo para descobrir quem era o mais inteligente.
Três jovens estavam sentados em círculo, frente a frente, em uma sala. O rei mostrou-lhes 5 chapéus, 2 pretos e 3 brancos. Em seguida, eles foram vendados e um chapéu foi colocado em cada uma de suas cabeças. Os outros dois chapéus foram colocados em outra sala. Depois que todos colocaram os chapéus e tiraram as vendas, o rei disse-lhes que quem conseguisse deduzir a cor do chapéu mais rápido se casaria com a princesa.
Agora você é um dos meninos e vê 2 chapéus brancos na cabeça dos outros meninos. E depois de algum tempo, você percebe que outros jovens mestres não conseguem adivinhar ou não ousam adivinhar. Suponha que você saiba que outros rapazes também são muito inteligentes. Então, seu chapéu é branco ou preto?

Para testar suas capacidades de raciocínio puro, desligamos antecipadamente a função de pesquisa na Internet e usamos apenas o modelo principal. Depois de fazer a pergunta, Qianwen 3 confiou em sua difícil capacidade de raciocínio para encontrar a resposta correta em apenas 24 segundos.

O que mais vale a pena mencionar em detalhes é que após a resposta ser concluída, Tongyi será lido automaticamente com uma voz – o tom é natural, o ritmo é suave e parece bastante confortável. Claro, se não quiser incomodar, você também pode desligar o pequeno alto-falante no canto superior direito com um clique.

Não há como esconder, o processo de pensamento de Qianwen 3 também é visível. A partir da lógica das respostas, todo o processo de raciocínio é claramente visível, as ideias são progressivas e organizadas e a veracidade das respostas é até verificada repetidamente.

Como o primeiro "modelo de raciocínio híbrido" na China, o Qianwen 3 permite a alternância livre entre o modo de raciocínio e o modo de conversação comum. No entanto, os testes reais mostram que quando você faz uma pergunta simples "10-5 =?", ele ainda pensará profundamente com uma atitude rigorosa, mas a velocidade de geração não diminuirá e a resposta será dada rapidamente.

Subindo o nível de dificuldade, tente um mais complicado. O Ano da Cobra, Lua da Cobra, Sol da Cobra, Hora da Cobra chegará em breve. Quantas vezes esse nó de tempo especial aparecerá em 2025?

Esta é uma questão de raciocínio de dados que combina o conhecimento do calendário tradicional, como o calendário lunar e a cronologia dos caules e ramos. Mesmo para pessoas que estão relativamente familiarizadas com o sistema cultural chinês, responder a esta pergunta requer múltiplas rondas de cálculos e verificações, e podem ocorrer erros se não tomar cuidado.

Para uma IA que não está familiarizada com o sistema de calendário lunar, é um desafio ainda maior, mas Qianwen 3 quase não hesitou e deu a resposta com rapidez e precisão: 3 vezes.

Além disso, também colocamos a questão da probabilidade final: pode um macaco digitar as obras completas de Shakespeare tocando aleatoriamente em uma máquina de escrever por um período infinito de tempo? Sob esta questão, Qianwen 3 não apenas fornece derivação matemática, mas também gera naturalmente questões extensas abaixo, que se enquadram no tema e desencadeiam reflexões mais aprofundadas.

"Retarded Bar" foi certificada como a melhor biblioteca chinesa de treinamento de IA e é o último bastião da humanidade que enfrenta o exército de IA. Então, "O Imperador de Jade viveu na estratosfera ou na troposfera?" Esta é uma pergunta que faz sorrir, mas também é uma excelente forma de testar a combinação de humor e bom senso cultural do modelo Qianwen 3.

Primeiro citou rigorosamente descrições mitológicas, apontou claramente que o Imperador de Jade vivia no Palácio Celestial e explicou a diferença física entre o Palácio Celestial e a atmosfera; depois acrescentou interpretações interessantes da Internet (pontos de vista pouco ortodoxos), dando respostas sérias, mas também sendo moderadamente irritantes.

É claro que as respostas de Qianwen 3 têm qualquer base, e as fontes de referência anexadas na parte inferior também acrescentam um pouco de convencimento.

Versão da Ópera de Pequim de "Harry Potter"? Criação transfronteiriça traz surpresas

A aplicação mais frequente de IA generativa ainda é a geração de conteúdo de mesa.

De outra perspectiva, Qianwen 3 pode gerar o roteiro para a versão da Ópera de Pequim de "Harry Potter e a Pedra Filosofal"? Qianwen 3 começou com um estrondo. O roteiro incorpora Xipi, Erhuang, Allegro e outros estilos de canto da Ópera de Pequim, e as mudanças emocionais estão em linha com a fórmula tradicional.

O libreto adota um estilo clássico com contrapontos elegantes e rimas naturais, o que está em linha com a linguagem da Ópera de Pequim, sem perder o sentido de fantasia da história de Harry Potter.

É claro que, quando as culturas atravessam fronteiras, elas têm mais medo de se aclimatarem. Letras como "Gryphons voam e saltam em todas as direções" são usadas para traduzir as quatro principais casas de Hogwarts, o que não apenas mantém a tensão das imagens, mas também evita a rigidez de copiar diretamente a terminologia ocidental.

Como um usuário acostumado a coletar respostas de IA de alta qualidade, gosto muito da função "Adicionar às notas" do Tongyi APP. Basta pressionar e segurar o conteúdo para coletá-lo com um clique. Se quiser compartilhá-lo com amigos, você também pode gerar diretamente um link de salto e repassá-lo facilmente.

A razão pela qual "Yansuo Pondliu" é conhecido como o eterno absoluto é em grande parte porque implica os cinco elementos de "ouro, madeira, água, fogo e terra". Usando a capacidade da base de conhecimento, a resposta dada por Qianwen 3 é, “Torre Pao Zhen Haicheng”, o número de palavras é o mesmo e elas são combinadas uniformemente.

Em termos de compreensão linguística, o modelo Qwen3 suporta até 119 idiomas e dialetos.

Ao lidar com a frase clássica "O amor adora amar o amor", as traduções comuns podem ser facilmente reduzidas a um acúmulo contundente, mas Qianwen 3 fornece uma versão mais elegante: "A compreensão profunda do amor, a admiração constante pela verdade do amor", que não apenas retém a beleza das palavras repetidas da frase original em inglês, mas também constrói um espaço poético em chinês, refletindo perfeitamente os padrões de tradução de "fidelidade, expressividade e elegância".

Programação de uma frase, fiz um jogo de Tetris no estilo Pokémon usando um significado geral.

O código é um destaque desta melhoria do Qianwen 3.

Na interface da versão web, basta abrir o “modo de código” na parte inferior da página, inserir seus requisitos e ele irá gerar o código com um clique. Além disso, o Qianwen 3 também está equipado com otimização de comando e quadrado de aplicativo, que pode ajudá-lo a se ajustar enquanto escreve e aprender e usar ao mesmo tempo.

Minha intenção original era criar um minijogo Tetris no estilo Pokémon para Qianwen 3. Inesperadamente, enquanto Qianwen 3 gerava a primeira versão do código, sua "função de polimento" integrada ajudou a otimizar minhas instruções originais.

Crie um jogo Tetris de arquivo único baseado em HTML/CSS/javaScript, com elementos de bloco projetados no estilo Pokémon.
O jogo contém os seguintes recursos:
Interface do jogo: A área do jogo é uma tela de 400×600 pixels e CSS é usado para definir a cor de fundo e o estilo da borda.

No entanto, talvez devido à sensibilidade aos direitos autorais, o código gerado não usou diretamente personagens Pokémon, mas projetou habilmente a cor dos blocos com o estilo de correspondência de cores do Pokémon.

Apesar disso, a experiência de corrida permanece suave como a seda.

Mais do que isso, fiz outro pedido, esperando que Tongyi me ajudasse a fazer um cartão meteorológico com efeitos animados. O requisito é usar HTML, CSS e JavaScript básico para obter atualizações dinâmicas de horário e informações meteorológicas.

Os resultados fornecidos por Tongyi são mais uma vez atraentes. Eles não apenas atendem aos requisitos funcionais, mas também adicionam pequenos ovos de páscoa ao design detalhado, como o gradiente de cor de fundo quando o tempo muda.

Depois de vivenciar isso, chegamos à conclusão de que comparado aos modelos anteriores que focavam apenas no “certo e errado”, o Tongyi é mais como um “segundo cérebro” que realmente entende suas necessidades. Seja raciocinando, criando ou programando, você pode responder de forma lógica e criativa.

Para a maioria dos usuários, eles realmente não se importam com as especificações dos parâmetros e as várias listas de modelos grandes, eles apenas se preocupam se são “fáceis de usar”.

O padrão "fácil de usar" aqui geralmente tem dois níveis. Primeiro, depende das capacidades do modelo básico. Mais importante ainda, é como comercializar os recursos do modelo para oferecer aos usuários uma experiência interativa mais amigável.

Como o pesquisador da OpenAI Yao Shunyu mencionou recentemente em seu blog: “Precisamos repensar como treinar IA e como medir o progresso, o que pode exigir uma forma de pensar mais próxima da de um gerente de produto”.

Após a medição real desta noite, a APPSO acredita que o atual Tongyi APP leva melhor em consideração esses dois aspectos. Ele funciona rápido, responde com precisão e é bastante inteligente. Em alguns lugares onde é fácil encontrar barreiras (como o polimento automático das instruções de programação), você verá naturalmente detalhes de interação apropriados, o que é uma rara sensação de peso e crescimento.

Na véspera do último feriado prolongado, o DeepSeek R1 detonou o modelo global de código aberto. Antes deste feriado de Primeiro de Maio, inauguramos o Qianwen 3. Além de modelos mais fortes, também possui melhores aplicações interativas, dando continuidade à onda de IA na China.

Bem-vindos a todos para acessar o Tongyi APP para experimentar Qianwen 3 e compartilhar uma jogabilidade mais interessante conosco na área de mensagens.

Autor: Li Chaofan, Mo Chongyu

# Bem-vindo a seguir a conta pública oficial do WeChat do aifaner: aifaner (WeChat ID: ifanr). Conteúdo mais interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo