Modelos grandes “reduzem” para telefones celulares, smart de parede lança MiniCPM, um pequeno canhão de aço de alto desempenho

Modelos grandes abrem uma nova era e devem ser nativos de IA.

Li Dahai, cofundador e CEO da Face Wall Intelligence, disse certa vez o que foi dito acima. Em sua opinião, a era dos modelos grandes exige IA nativa, e o hardware do modelo grande executado no lado do dispositivo é hardware nativo.

Esta tarde, a Wall-facing Intelligence lançou oficialmente o carro-chefe 2B, modelo grande de lado final, MiniCPM voltado para parede, e o campo de batalha de modelo grande de lado final dará as boas-vindas a um novo jogador.

Com pequena potência e grande potência, o pequeno canhão de aço de desempenho 2B está "na máquina"

Informamos anteriormente que Mistral AI, a "versão europeia do OpenAI", lançou um modelo pequeno Mistral-7B curto e compacto, embora tenha apenas 7B de tamanho, seu desempenho e consumo de energia foram altamente elogiados.

O MiniCPM, que tem apenas 2B de tamanho, ultrapassou o Mistral-7B em pontuações médias em chinês e inglês em muitas listas de avaliação convencionais. MiniCPM tem recursos mais abrangentes e suas pontuações superaram o modelo estrela Phi-2 da Microsoft em testes de benchmark como CEval, CMMLU e MMLU.

Em termos de pontuação média na lista inglesa, o MiniCPM superou significativamente modelos de escala igual ou até maior, sendo até comparável a modelos de escala 13B, 30B e 40B. No conjunto de avaliação MT-Bench que está mais próximo da avaliação humana, o MiniCPM pode até competir com o Claude 2, tornando-o um canhão de desempenho 2B.

Então, como a inteligência voltada para a parede atinge o objetivo de usar pequenas coisas para fazer grandes coisas acontecerem?

  • Poder computacional: infra eficiente em todo o processo, aceleração de inferência em 10x, redução de custos em 90%;
  • Algoritmo: O túnel de vento modelo voltado para a parede é pequeno e grande, e configurações eficientes de treinamento de modelo são encontradas para alcançar a rápida formação de capacidades do modelo;
  • Dados: Em termos de fábrica de dados moderna, forma uma versão do modelo de tração em circuito fechado para iteração rápida da governança de dados à avaliação multidimensional;

MiniCPM também é um bom player em recursos básicos, como geração de modelos grandes. Li Dahai, cofundador e CEO da Face Wall Intelligence, apresentou no lançamento que o MiniCPM não apenas conhece com precisão a altitude do Monte Huangshan e do Monte Tai, calcula a diferença, mas pode até escrever código para autodesenvolvimento e otimização.

À medida que a competição por modelos grandes se torna cada vez mais acirrada em 2024, a adição de capacidades multimodais está empurrando a inteligência artificial para a era da "sinestesia".O MiniCPM, que é conhecido como a capacidade multimodal mais forte da sua classe, também realizou multi -modalidade em telefones celulares. Ele pode identificar com precisão criaturas perigosas, como cogumelos venenosos e cobras venenosas na natureza.

Li Dahai demonstrou o efeito do MiniCPM em aplicações práticas no local. Quando o modo avião está ativado e são feitas perguntas sobre medidas de auto-resgate para comer acidentalmente cogumelos venenosos ou se perder na natureza, as respostas do MiniCPM parecem ser mais práticas do que "clichês" vazios. Se você encontrar condições de sinal ruins, essas sugestões fornecidas pelo MiniCPM offline podem ser de grande ajuda para você.

Na competição tecnológica em escala crescente, o custo é a competitividade invisível dos grandes modelos.Além do seu poderoso desempenho, o custo de inferência do MiniCPM é de apenas 1% do Mistral-Medium.

Como um modelo de terminal em grande escala, o MiniCPM foi executado com sucesso nas principais marcas internacionais de telefones celulares e chips de CPU de terminal. Mesmo telefones celulares antigos podem funcionar normalmente. No entanto, do ponto de vista do rendimento, a operação ainda está em execução, e o real o desempenho pode precisar ser melhorado.

Com base no acúmulo de inteligência na área de grandes modelos, Li Dahai também anunciou oficialmente na conferência de imprensa que abrirá ainda mais o código-fonte, "deixará grandes modelos voarem para milhares de lares". O endereço de código aberto (incluindo relatório técnico) é o seguinte:
MiniCPM GitHub: https://github.com/OpenBMB/MiniCPM
OmniLMM GitHub: https://github.com/OpenBMB/OmniLMM

No final da conferência de imprensa, Li Dahai também demonstrou as capacidades de interação multimodal em tempo real do modelo mniLMM-12B. Semelhante à ideia anterior do modelo grande do Google Gemini demonstrando recursos multimodais, eles também pediram ao MiniCPM para jogar um "jogo de adivinhação" de pedra, papel e tesoura. Os resultados mostraram que a suavidade, a precisão e o atraso do as suas respostas estavam todas dentro de níveis aceitáveis.

A capacidade de raciocínio lógico também é um destaque importante. Depois de enviar uma imagem sem descrição de texto, ele pode inferir com precisão o significado da imagem com base em pequenos detalhes, como roupas, óculos de sol e bengalas, demonstrando plenamente sua capacidade abrangente de "ver e pensar".

Internet de Agentes

"Se as capacidades dos agentes forem usadas em modelos finais, elas poderão atender melhor a cenários específicos e criar mais valor. Acho que essas duas direções podem apoiar-se mutuamente e produzir algumas reações químicas maravilhosas."

Zeng Guoyang, CTO da Wall-Facing Intelligence, falou sobre a relação entre o grande modelo do lado do terminal e o Agente. Nesta conferência de imprensa, Li Dahai também reiterou a estratégia de motor duplo do grande modelo + agente. Na sua opinião, o lançamento do MiniCPM ainda serve a estratégia de motor duplo.

Na verdade, quando grandes modelos procuram ser integrados em cenários de aterragem, o AI Agent torna-se uma abordagem chave. Wall-Facing Intelligence é uma das primeiras empresas a propor o conceito de Agente. Oficiais da Wall-Facing Intelligence chegaram a afirmar que o mundo futuro será um mundo de Agentes, e tudo será um Agente.

Imagine que quando você estiver pronto para fazer mingau, basta colocar os ingredientes na panela de arroz, esperar um pouco e sairá uma panela fumegante de mingau. Durante esse processo, a panela de arroz usa a tecnologia Agent integrada para ajustar automaticamente a temperatura e o calor., o cozimento pode ser concluído sem intervenção manual.

Na Conferência Yunqi do ano passado, Li Dahai disse: “Modelo grande + Agente trará uma nova rodada de grandes mudanças tecnológicas”.

Naquela época, ele comparou modelos grandes ao motor de um carro, que fornece energia ao carro. Porém, para construir um carro completo, você também precisa de direção, chassi e tudo mais.

Da mesma forma, ele acredita que, com base no motor de grandes modelos, uma série de tecnologias de nível superior, como capacidades de memória e capacidade de usar ferramentas, precisam ser sobrepostas para expandir perspectivas de aplicação e imaginação mais amplas. AI Agent é a entidade que possui essas capacidades técnicas.

Desde a sua criação, Wallface Intelligence começou a planejar a rota técnica e a direção de implementação do "grande modelo + agente" e lançou sucessivamente a "troika" de agentes de IA – XAgent, AgentVerse e ChatDev.

Esses três produtos são todos impulsionados por grandes modelos e representam a inovação de ponta e os resultados de aplicação do AI Agent. Eles visam combinar grandes modelos com o ambiente real. Entre eles, o XAgent é uma grande estrutura de aplicativo de agente de IA orientada por modelo e AgentVerse é uma plataforma universal para agentes, enquanto ChatDev é uma estrutura de desenvolvimento colaborativo multiagente.

Específico para a direção de implementação do ToB, espera-se que o Agente de IA desempenhe múltiplas funções dentro da empresa e remodele os processos operacionais e a estrutura organizacional da empresa. Esses agentes de IA podem realizar diversas tarefas, de forma semelhante aos funcionários de empresas tradicionais, reduzindo assim custos e aumentando a eficiência.

Para aplicações de consumo (ToC), o AI Agent pode aparecer na forma de um assistente inteligente para fornecer aos usuários serviços personalizados e convenientes. Esses assistentes inteligentes podem compreender e prever as necessidades do usuário e fornecer ajuda e sugestões em tempo real, melhorando assim a experiência do usuário e a qualidade de vida.

Então, como deve ser o futuro do AI Agent?

A visão e o conceito de Wall-Facing Intelligence é "Internet de Agentes", que permite aos Agentes de IA conectar tudo no mundo e realizar a transformação de "Internet de Tudo" em "Inteligência de Tudo".

Este conceito foi proposto por Liu Zhiyuan, professor associado permanente do Departamento de Ciência da Computação da Universidade Tsinghua e fundador da Wall-Facing Intelligence, que também disse com confiança em um discurso público:

Enfrentando o futuro, mais pessoas, dispositivos e objetos podem ser conectados por meio de grandes plataformas inteligentes orientadas por modelos, promovendo a Internet de Todas as Coisas à Internet Inteligente de Todas as Coisas e entrando em uma nova era de Internet das Coisas inteligente (loA) de homem-computador interação. Daremos início ao segundo surgimento da inteligência artificial.

Na imaginação deste grande especialista que trabalha na área de informática há décadas, o segundo surgimento da inteligência artificial é associar agentes individuais com suas próprias forças para formar uma inteligência de grupo complexa, mostrando assim um comportamento emergente mais poderoso.

Em uma recente entrevista online entre Li Dahai e Kevin Kelly, autor de "Out of Control", Kevin Kelly também expressou opiniões semelhantes. Ele acredita que a colaboração entre IAs tem um enorme potencial e, no futuro, um ecossistema composto por centenas ou mesmo milhares de IAs diferentes será formado, liberando um poder incrível.

Na verdade, a inteligência de enxame, como fenômeno comumente encontrado na natureza e na sociedade, refere-se à capacidade de um grupo composto por muitos indivíduos simples de exibir um alto nível de comportamento inteligente. Na natureza, esse comportamento inteligente se manifesta de diversas formas, como ações coletivas de colônias de formigas, enxames de abelhas e cardumes de peixes.

Quando as formigas procuram fontes de alimento ou retornam aos seus ninhos, elas liberam feromônios para orientar suas companheiras a encontrar o caminho mais curto. Ao migrar, os cardumes de peixes formam um padrão de natação protetor, coordenando estreitamente as suas posições e ações, permitindo que todo o grupo evite eficazmente os predadores e poupe energia.

Li Dahai também pegou emprestado os famosos ditados de "O Problema dos Três Corpos" para definir uma bandeira de Ano Novo – para fazer a AGI vir "mais rápido", ecoando a visão da Wall-facing Intelligence Company de "inteligir todas as coisas".

A beleza da vida é estar obcecado por alguma coisa. A vida é muito curta, não faça coisas frívolas.

# Bem-vindo a seguir a conta pública oficial do WeChat de aifaner: aifaner (WeChat ID: ifanr).Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo