Um novo modelo aproximando-se do GPT-4 é lançado! A “versão europeia do OpenAI” associou-se à Microsoft, mas foi questionada por violar a sua intenção original
Ontem à noite, Mistral AI, conhecido como "European OpenAI", lançou seu mais recente modelo de geração de texto de alto nível, Mistral Large.
Este modelo possui recursos de raciocínio de alto nível e pode ser usado para lidar com tarefas complexas de raciocínio multilíngue, abrangendo compreensão de texto, transformação e geração de código.
Basta desenhar os pontos-chave:
- Janela de contexto de 32K para extrair com precisão informações de documentos grandes.
- Recursos precisos de seguimento de comandos permitem que os desenvolvedores personalizem estratégias de auditoria.
- Suporta restrições de chamada de função e modo de saída para ajudar a dimensionar o desenvolvimento de aplicativos e modernizar pilhas de tecnologia.
- Suporte nativo para inglês, francês, espanhol, alemão e italiano, com profundo conhecimento gramatical e cultural.
Em anexo está o endereço da experiência: https://chat.mistral.ai/chat
Mistral AI expande suas habilidades novamente
O Mistral Large teve um bom desempenho em vários testes de benchmark, tornando-se o segundo modelo mais utilizado no mundo por meio de API, perdendo apenas para o GPT-4, e deixando para trás outros modelos convencionais.
Comparado com LLaMA 2 70B, GPT-4, Claude 2, Gemini Pro 1.0 e outros modelos convencionais, o Mistral Large mostra grande força nas capacidades de raciocínio.
Em vários benchmarks de bom senso e raciocínio, como MMLU, Hellas e WinoG, o Mistral Large segue o GPT-4 e excede em muito outros modelos.
Mistral Large tem desempenho significativamente melhor que LLaMA 2 70B nos benchmarks HellaSwag, Arc Challenge e MMLU em francês, alemão, espanhol e italiano.
Mistral Large também teve um bom desempenho em tarefas de codificação e matemática. Muitos testes de benchmark ainda estão muito à frente.
Além disso, a Mistral AI também lançou um novo modelo otimizado para latência e custo, o Mistral Small, que supera o Mixtral 8x7B em desempenho, mas tem menor latência.
Na opinião da Mistral AI, o Mistral Small será uma escolha intermediária ideal entre modelos de código aberto e modelos emblemáticos, desfrutando das mesmas vantagens inovadoras do Mistral Large, especialmente em termos de ativação e chamadas de função RAG (Retrieval Augmentation Generation).
No entanto, as características de baixa latência reivindicadas pelo modelo Mistral Small são limitadas em comparação com o Mixtral 8x7B, mas o seu custo é significativamente aumentado, com o custo de entrada sendo 2,8 vezes maior e o custo de saída chegando a 8,5 vezes.
Mistral Large já está disponível nas plataformas La Plateforme e Azure, e integrado ao Le Chat. Le Chat (traduzido literalmente como gato em francês) é um chatbot de IA semelhante ao ChatGPT que suporta comunicação multilíngue.
Os usuários podem escolher entre três modelos diferentes: Mistral Small, Mistral Large e Mistral Next. No entanto, Le Chat não oferece suporte à funcionalidade de rede em tempo real.
Pouco depois do lançamento, o Le Chat travou devido a uma multidão maior do que o esperado reunindo-se para a experiência e, no momento desta publicação, o Le Chat está de volta ao funcionamento.
Também experimentamos o Le Chat pela primeira vez. Dependendo da complexidade do idioma em si e da quantidade e qualidade dos dados de treinamento que recebe, o Le Chat é mais expressivo em inglês e pode variar de idioma para idioma em outros idiomas.
Diante do quebra-cabeças chinês, Mistral Large ficou obviamente um pouco confuso e não respondeu por um tempo.
Pergunta: Borboleta, formiga, aranha, centopéia, trabalham juntas, qual delas no final não recebe?
Mas se você mudar para o inglês, ele imediatamente se transforma em um especialista em resolução de problemas. As respostas são claras e lógicas, e ele se eleva a uma "perspectiva de trabalho e recompensas centrada no ser humano". não siga o bom senso, afinal, "Centopéia" não é recompensada.
O problema de galinhas e coelhos vivendo na mesma gaiola não é moleza para Mistral Large. Depois de colocar as equações lineares, a resposta saiu rapidamente, mas as 16 galinhas e os 19 coelhos da resposta estavam incorretos.
Pergunta: Há galinhas e coelhos na mesma gaiola, com um total de 35 cabeças e 94 patas. Quantos são as galinhas e os coelhos?
Este é um problema matemático clássico que pode ser resolvido usando um sistema de equações lineares.
Supondo que o número de galinhas seja x e o número de coelhos seja y, as duas equações a seguir podem ser listadas:
1. x + y = 35 (o número total de galinhas e coelhos é 35)
2. 2x + 4y = 94 (a galinha tem 2 patas e o coelho tem 4 patas, então são 94 patas no total)
Expresse x na primeira equação como uma função de y para obter x = 35 – y, e substitua-o na segunda equação para obter:
2(35 – y) + 4y = 94
Resolver a equação nos dá y = 19. Substituindo x = 35 – y nos dá x = 16.
Portanto, existem 16 galinhas e 19 coelhos.
As duas últimas questões podem ser resolvidas da mesma forma: as respostas são 16 galinhas e 19 coelhos.
Em seguida, pedimos ao ChatGPT que aplicasse ao Mistral Large uma questão de teste de matemática, que foi mais intensa, mas o desempenho geral foi bom:
Modelo pequeno, grande conquista
A Mistral AI foi fundada em maio do ano passado com apenas 25 funcionários, mas seu grande modelo de linguagem já se tornou famoso no Hugging Face.
Anteriormente, informamos que ele lançou o Mixtral 8x7B. Assim que este modelo foi lançado, ele instantaneamente detonou a comunidade de código aberto e manteve inúmeros desenvolvedores acordados à noite.
Embora tenha apenas um tamanho de parâmetro de 46,7B, o desempenho do Mixtral 8x7B, que é bom em pequenos e grandes, é comparável ao Llama 2 70B e GPT-3.5 em muitos testes de benchmark, e até um pouco melhor em alguns testes.
O segredo do sucesso da Mistral AI reside na integração inteligente dos três elementos principais do campo da IA – talento, dados e poder computacional.
The Economist revelou que os fundadores e a espinha dorsal técnica da Mistral AI vieram todos dos institutos técnicos de elite da França e acumularam uma valiosa experiência industrial nos laboratórios de pesquisa de gigantes da tecnologia como Google e Meta. Eles são um dos poucos especialistas no mundo que realmente dominam como treinar modelos de tecnologia de ponta.
Em segundo lugar, os dados são outra arma mágica para o sucesso da Mistral AI. Mistral é único no treinamento de dados de modelo, por exemplo, o modelo pode filtrar com eficácia informações repetitivas ou sem sentido, tornando o modelo mais simplificado e eficiente, com uma escala de parâmetros de apenas bilhões.
Isso significa que usuários comuns podem executar facilmente modelos Mistral AI em seus próprios computadores pessoais.
Pela chegada do Mistral Large, o vencedor do Prêmio Turing Yann LeCun, o cientista sênior da NVIDIA Jim Fan e outros grandes nomes também enviaram parabéns pelo X.
Actualmente, a avaliação da Mistral AI ultrapassou os 2 mil milhões de dólares e o conjunto de investimentos por detrás dela não é inferior ao das principais empresas do mundo.
Desde as principais empresas de capital de risco dos Estados Unidos, como Lightspeed Venture Capital, Redpoint Venture Capital e Index Venture Capital, até os gigantes de capital de risco do Vale do Silício a16z, NVIDIA, Salesforce, BNP Paribas, etc., todos eles favorecem a Mistral AI. Após várias rodadas de financiamento, a Mistral AI já entrou nas fileiras dos unicórnios da IA.
A Microsoft também anunciou ontem uma nova parceria com a Mistral AI, prometendo que a cooperação com a Mistral AI se concentrará nas seguintes três áreas principais:
Infraestrutura de supercomputação: a Microsoft dará suporte à Mistral AI por meio da infraestrutura de supercomputação de IA do Azure para treinamento de IA e cargas de trabalho de inferência.
Mercado expandido: a Microsoft e a Mistral AI disponibilizarão os modelos avançados da Mistral AI aos clientes por meio do Catálogo de modelos MaaS e Azure Machine Learning no Azure AI Studio.
P&D de IA: A Microsoft e a Mistral AI explorarão a colaboração para desenvolver modelos proprietários para clientes selecionados, mesmo para cargas de trabalho do setor público europeu.
Mas a decisão da Microsoft foi questionada pelos internautas. O usuário X @osxzxso insinuou que a Microsoft está tentando adotar uma estratégia “intricada” para monopolizar o mercado. Musk também expressou sua concordância na seção de comentários com um emoji surpreendente.
Espalhando Nutella nos dois lados do pão eu vejo
Eu vi manteiga de amendoim espalhada nos dois lados do pão
Vale ressaltar que internautas cuidadosos observaram que depois que a Mistral AI lançou o novo modelo, o conteúdo relevante em seu site oficial sobre seu compromisso com a comunidade de código aberto desapareceu silenciosamente, e o novo modelo não suporta código aberto.
No entanto, o CEO da Mistral, Mensch, disse numa entrevista ao Wall Street Journal que a Mistral AI não violou a intenção original do código aberto, mas adoptou uma estratégia dupla de promover simultaneamente estratégias de comercialização e manter compromissos de código aberto.
É evidente que precisamos de encontrar um equilíbrio delicado entre a construção de um modelo de negócio e a manutenção dos nossos valores de código aberto. Queremos inventar coisas novas e novas arquiteturas, mas também oferecer aos nossos clientes produtos mais vendáveis.
# Bem-vindo a seguir a conta pública oficial do WeChat de aifaner: aifaner (WeChat ID: ifanr).Mais conteúdo interessante será fornecido a você o mais rápido possível.