A versão europeia do DeepSeek lança um novo modelo, direcionado à IA chinesa.

Após ser pressionada por OpenAI, Google e pelos modelos chineses de código aberto DeepSeek e Qwen por mais de meio ano, a Mistral AI, conhecida como a "versão europeia do DeepSeek" , finalmente não conseguiu ficar parada e lançou oficialmente a nova geração de modelos da série Mistral 3.

A Mistral AI é uma empresa de modelagem em larga escala com sede na França. Em setembro deste ano, a Nvidia teria investido na startup pela terceira vez. Isso elevou o valor de mercado da Mistral para aproximadamente US$ 13,5 bilhões, tornando-a um dos unicórnios mais proeminentes do setor de IA na Europa.

Desta vez, a Mistral visou especificamente o modelo chinês.

Desta vez, a Mistral 3 traz o modelo principal Mistral Large 3, bem como três modelos menores de alto desempenho e custo-benefício: Ministral (3B, 8B, 14B).

Dentre eles, o Mistral Large 3 é o protagonista absoluto, com um total de 675 parâmetros, dos quais 41 são ativos. Este é o primeiro modelo expert misto Mistral com pesos abertos desde o Mistral 8x7B e 8x22B, lançados entre o final de 2023 e o início de 2024.

Mas o que eu acho mais "inquietante" é a estratégia oficial de comparação.

Nos gráficos de referência oficiais, a Mistral ignorou completamente o GPT-5.1 ou o Gemini 3 e, em vez disso, mirou diretamente no DeepSeek-V3.1 e no Kimi-K2 da China.

A lógica de Mistral é simples: eu tenho apenas metade do número de parâmetros que Kimi, mas meu desempenho é equivalente ao seu, ou até superior.

Os resultados oficiais são os seguintes:

  • Probabilidades de vitória: No MMMLU e no AMC, o Mistral Large 3 obteve 85,5 e 52,0 pontos, respectivamente, ficando ligeiramente à frente do DeepSeek-V3.1.
  • Derrota: Nos testes LiveCodeBench e SimpleQA, que são os de maior interesse para os programadores, o Mistral Large 3 ainda perdeu para o Kimi-K2.


É menos inteligente que o DeepSeek e três vezes mais caro?

Embora a Mistral esteja tentando se provar como a "rainha da eficiência", os blogueiros de tecnologia do X jogaram um balde de água fria nela, chegando a usar a dura expressão "a Mistral está morrendo lentamente".

Sua avaliação foi sucinta e direta, listando três falhas principais no novo modelo da Mistral:

1. Menos inteligente: Não tão inteligente quanto o DeepSeek.
2. Mais caro: Custa três vezes mais que o DeepSeek.
3. Mais lento: Sua velocidade de inferência é ainda mais lenta que a do GPT-5.

Isso certamente acerta em cheio. No mais recente ranking abrangente de IA da Artificial Analysis, a Mistral Large 3 obteve apenas 38 pontos.

Vejamos quem está no topo: Gemini 3 Pro (73 pontos), Claude Opus 4.5 (70 pontos) e GPT-5.1 (70 pontos). A diferença entre o Mistral e os melhores não é apenas uma questão de "alcançar", mas sim uma completa descontinuidade.

Na tabela de classificação do LMARaena, ocupa o segundo lugar entre os modelos de código aberto que não utilizam inferência e o sexto lugar na classificação geral. Os resultados são respeitáveis, mas certamente não se qualificam como um modelo que "domina a liderança".

Os avaliadores constataram que o Mistral Large 3 teve um desempenho ruim em todos os aspectos:

  • Este modelo tem dificuldade em executar chamadas de ferramentas corretamente, frequentemente gerando instruções de chamada de ferramenta formatadas incorretamente ou inválidas.
  • Seu desempenho em testes de desempenho baseados em imagens é apenas razoável.

O que realmente vale a pena investir é no modelo de pequena escala.

O Ministral 3 é o produto mais econômico entre todos os modelos de código aberto. Ele oferece versões básica, didática e de inferência para cada escala de parâmetro, todas com recursos de compreensão de imagens, e é totalmente de código aberto sob a licença Apache 2.0.

O que isso significa? Você pode usá-lo gratuitamente e modificá-lo como quiser.

  • Versátil: Suporta a compreensão de imagens em todos os tamanhos, não sendo mais "às cegas".
  • Desempenho: A versão de inferência do 14B alcançou uma precisão de 85% no teste AIME'25.

O Mistral 3 realmente progrediu. Como disseram internautas, ainda existe um fabricante de modelos líder na Europa que consegue acompanhar o ritmo dos modelos de código aberto na China. Embora o Mistral ainda não tenha lançado um mecanismo de inferência, seu desempenho real ainda está defasado.

Mas, com a DeepSeek reduzindo o preço dos modelos maiores, oferecer simplesmente um "desempenho decente" já não é suficiente. Os usuários querem inteligência máxima ou preço acessível.

Atualmente, o Mistral parece estar preso numa posição intermediária incômoda. Se ele poderá se tornar um "farol de esperança para a Europa" dependerá, na verdade, de iterações futuras.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

ifanr | Link original · Ver comentários · Sina Weibo