Este produto chinês de IA apareceu na tela durante a noite! Toda a Internet está pedindo códigos de convite, o que pode ser a maior surpresa depois do DeepSeek

Quase ao mesmo tempo em que a Apple lançou novos produtos na noite passada, todo o círculo tecnológico foi varrido por um produto chamado Manus.

Este é o primeiro agente de IA verdadeiramente universal do mundo. Como pode ser visto nos casos exibidos no site oficial, ele pode pensar, planejar e executar tarefas complexas de forma independente e entregar resultados completos diretamente.

Comparado com agentes como Claude's Computer Use, que também podem realizar multitarefas ou ajudá-lo a pedir comida e reservar um hotel, Manus pode cobrir mais áreas e alcançar maior qualidade de execução.

Manus estabeleceu um novo recorde no teste de benchmark GAIA e seu desempenho excede em muito o de produtos similares da OpenAI.

O nome Manus vem do latim, Mens et Manus, que significa mente e mão, ou seja, usar as duas mãos e o cérebro. Esse também é o lema do Massachusetts Institute of Technology, que incentiva os alunos a transformarem suas ideias em resultados práticos.

Poucas horas antes do lançamento de Manus, o fundador Xiao Hong postou uma postagem na plataforma instantânea “O clímax está chegando” e compartilhou um trecho do livro de Shakespeare:

É difícil determinar agora que o nascimento de Manus é um marco para a AGI, mas é muito provável que realmente traga a era do Agente (inteligente) para um “momento de clímax”.

Link do aplicativo de experiência Manus  :
https://manus.im/invitation

Triagem de currículos, seleção de imóveis e negociação de ações, Manus é realmente bom em “trabalhar”?

As autoridades afirmam que Manus não é apenas uma ferramenta de IA conversacional que só pode conversar, mas um agente verdadeiramente autônomo.

Embora outras IAs possam parar na geração de ideias, Manus é capaz de pensar e agir por conta própria. As autoridades consideram-no um novo paradigma de colaboração homem-máquina e pode até ser uma janela para a AGI.

Simultaneamente com Manus, há também uma demo de quatro minutos. Nestes casos, Manus concluiu todo o processo, desde o planejamento até a execução, de forma totalmente autônoma, demonstrando capacidades reais do agente em vez de simples funções de assistente.

Por exemplo, comece com uma tarefa comum de RH: triagem de currículos.

A demonstração começou com um grande truque. O funcionário enviou a Manus um arquivo compactado contendo 10 currículos. Manus poderia trabalhar com a mesma eficiência de um recrutador profissional.

Ele primeiro descompactará o arquivo, depois percorrerá cada currículo página por página e registrará informações importantes. Manus também pode processar arquivos de forma assíncrona, o que significa que você pode desligar o computador a qualquer momento e ele irá notificá-lo quando a tarefa for concluída.

Claro, você também pode fornecer novas instruções a qualquer momento durante esse processo.

Em seguida, faça o upload de 5 currículos para Manus. Depois de ler atentamente todos os 15 currículos, Manus fez recomendações de classificação e forneceu perfis de candidatos e critérios de avaliação para referência.

Ainda não é tudo, também podemos pedir ao Manus para gerar uma planilha.

Devido ao conhecimento e à capacidade de memória do Manus, na próxima vez que uma tarefa semelhante for executada, ele entregará os resultados diretamente na forma de uma planilha.

Num outro caso de demonstração, Manus é solicitado a examinar uma comunidade segura e com baixa criminalidade em Nova Iorque, com base no rendimento familiar e nos requisitos de escolaridade das crianças, e a comprar propriedades que cumpram os critérios.

Diante de tarefas tão complexas, Manus também as divide metodicamente em várias etapas e cria listas de tarefas detalhadas.

  • Pesquise e leia artigos sobre os bairros mais seguros de Nova York.
  • Pesquise escolas secundárias em Nova York.
  • Escreva um programa Python para calcular o orçamento.
  • Com base no seu orçamento, selecione listagens adequadas em sites imobiliários.
  • Integre todas as informações, escreva relatórios detalhados e organize materiais relevantes

Passando para o terceiro caso, Manus transformou-se em analista de ações profissional.

Deixe-o analisar a correlação entre os preços das ações da Nvidia, Marvell Technology e TSMC nos últimos três anos. Manus pode acessar fontes de dados confiáveis ​​por meio de APIs. Após validar os dados, ele começa a escrever o código para análise e visualização dos dados.

Após concluir a análise e visualização dos dados, Manus também pode criar um site com base nos dados. Com a autorização do usuário, o site pode ser implantado online e um link compartilhável é fornecido.

X Netizen @DavidAIinchina também experimentou Manus e deu uma avaliação muito alta – "caso de uso incrível".

As autoridades afirmaram que o conteúdo exibido acima é apenas a ponta do iceberg das habilidades de Manus.

No benchmark GAIA, que é usado para avaliar a capacidade dos assistentes de IA de uso geral para resolver problemas do mundo real, Manus obteve desempenho SOTA em todos os três níveis de dificuldade.

Para garantir a reprodutibilidade dos resultados, o Manus foi avaliado exatamente com a mesma configuração de sua versão oficial.

Além do benchmarking, Manus resolve problemas do mundo real em plataformas como Upwork e Fiverr e provou sua habilidade em competições Kaggle.

Tudo isto é inseparável da excelente comunidade de código aberto, por isso o responsável também espera retribuir à comunidade.

Manus usa um sistema de múltiplas assinaturas (multisig) conduzido por vários modelos independentes. Ainda este ano, as autoridades planejarão abrir o código de alguns desses modelos, especialmente a parte de raciocínio (postagem) do Manus.

Equipe chinesa, dois produtos de sucesso, milhões de usuários

Então, quem está por trás deste produto que agita a indústria?

É relatado que Xiao Hong, o fundador da Manus AI, é ex-aluno de 2015 do curso de engenharia de software da Universidade de Ciência e Tecnologia de Huazhong.

Após a formatura, ele continuou a iniciar negócios. Em 2015, fundou a Nightingale Technology, lançou o "Yiban Assistant" e o "Weiban Assistant", atendeu mais de 2 milhões de usuários finais B e recebeu investimentos da Tencent, ZhenFund e outros.

Há também um produto de IA mais distinto que permanece em Xiao Hong – Monica.

Este é um assistente de IA conhecido como All-in-One, originalmente lançado como um plug-in de navegador.

Ao integrar grandes modelos convencionais (como Claude 3.5, DeepSeek, etc.), Monica fornece funções como chat, tradução, processamento de direitos autorais, etc. Os usuários podem criar ferramentas personalizadas por meio de linguagem natural e compartilhá-las no Tool Plaza.

Monica também se concentrou em mercados internacionais em seus primeiros dias, com uma base de usuários superior a um milhão e se tornando um produto líder na área de plug-ins de IA.

Em fevereiro deste ano, a versão chinesa do Monica (monica.cn) iniciou testes internos e atualmente está aberta gratuitamente para usuários domésticos. Esta versão é baseada nos modelos DeepSeek R1 e V3, possui capacidades profundas de raciocínio e pensamento e suporta funções de memória e pesquisa na Internet em tempo real.

Filosofia técnica de Manus: menos estrutura, mais inteligência

A filosofia técnica seguida por Manus também é um pouco diferente da corrente principal: “menos estrutura, mais inteligência”.

Eles acreditam que quando os dados são de alta qualidade, o modelo é poderoso o suficiente, a arquitetura é flexível o suficiente e a engenharia é sólida o suficiente, capacidades como uso de computador, pesquisa profunda e agentes de codificação surgirão naturalmente, sem serem projetadas como funções específicas do produto.

Como um dos representantes do trabalho duro para alcançar milagres, a pontuação média do GPT-4-Turbo nas classificações públicas do GAIA é inferior a 7%, e mesmo soluções que utilizam sistemas multiagentes complexos atingem apenas 40%. Pode-se dizer que o desempenho de Manus está "muito à frente".

Em uma entrevista recente com Zhang Xiaojun, o fundador Xiao Hong também falou antecipadamente sobre o então inédito produto Agent Manus.

"Realmente parece que deveria ser um chatbot. Isso está de acordo com a imaginação de todos, mas ao mesmo tempo é muito complicado do lado da aplicação. Ao contrário de Monica, apenas usar modelos diferentes é bastante complicado."

Xiao Hong também dividiu os aplicativos de IA atuais em duas categorias: uma é preencher as lacunas nos principais produtos de aplicativos e a outra é fornecer soluções exclusivas para cenários específicos. Por exemplo, Perplexity (fornecendo função de pesquisa de rede) e Monica (formulário de plug-in do navegador) se enquadram nesta categoria e preenchem as lacunas deixadas pelos produtos existentes.

Aplicações como novas cenas baseadas em modelos aparecem principalmente nas áreas de fotos e vídeos e são diretamente impulsionadas pelo avanço da tecnologia de modelos. Produtos como Pika e Runway aproveitam os recursos do modelo para criar novos cenários de aplicação.

Alguns usuários ridicularizaram Manus como “o shell definitivo é incrível”. Na verdade, Xiao Hong não tem vergonha de informar aos usuários que seus produtos usam modelos de outras pessoas. Já no ano passado, ele comparou Monica aos eletrônicos de consumo e colocou o logotipo do ChatGPT no site oficial.

Uma nova era de interação humano-computador chegou, mas não se apresse em colocar Manus no altar da AGI.

A APPSO fez uma previsão no início de 2024: modelos grandes se tornarão o novo sistema operacional para smartphones, e a interface de usuário natural (NUI) substituirá gradualmente a interface gráfica de usuário (GUI) existente.

A entrada importante para concretizar esta nova interação é o Agente.

Vimos casos semelhantes em muitos lançamentos de celulares no ano passado. A conferência de imprensa da Vivo mostrou “Phone GPT” que pode pedir comida com IA, Xiaoyi e Intent Framework da Huawei Hongmeng, corpo inteligente YOYO da Honor e AutoGLM da Zhipu.

Deixe a IA imitar o ciclo humano Planejar-Fazer-Verificar-Agir (Planejar-Fazer-Verificar-Agir) para operar o equipamento como humanos.

O CEO da Zhipu AI, Zhang Peng, mencionou antes que os recursos atuais do agente são mais como adicionar uma camada de agendamento inteligente entre usuários e aplicativos para vincular todos os aplicativos e até mesmo todos os dispositivos.

Isto pode ser visto como um protótipo do sistema operacional geral de grande modelo LLM-OS, que terá um grande impacto na forma de interação humano-computador. O membro fundador da OpenAI e guru da tecnologia de IA, Andrej Karpathy, também falou muitas vezes sobre o Large Language Model Operating System (LLM OS).

Ele acredita que o grande modelo é, até certo ponto, um novo computador e sistema operacional que pode conectar diversos softwares e hardwares, bem como periféricos compostos por todas as informações modais, e realizar diversas tarefas por meio de chamadas de função.

Em um sistema operacional tradicional, você precisa construir vários periféricos em torno da CPU, como mouse e teclado, armazenamento em disco e espaço de cache.

No LLM OS, o próprio modelo grande é a unidade central de processamento. Os periféricos de E/S não são mais mouse e teclado, porque o LLM pode ser compatível com mais modos de entrada e saída de dados. Ao mesmo tempo, ferramentas externas chamadas por grandes modelos também serão atualizadas de software tradicional para ferramentas de agentes inteligentes.

Entre eles, a operação entre aplicações é um elo muito crítico, o que significa que o Agente pode realizar operações mais complexas, autônomas e coerentes, e também pode avançar em direção à comercialização real. Quanto à possibilidade de ligação dos serviços prestados por diversas empresas de Internet, este pode ser o maior obstáculo para a concretização deste tipo de interacção no futuro.

No entanto, muitos assistentes de IA agora implementam operações de proxy chamando os recursos de acessibilidade do telefone para controlar os cliques na tela.

O surgimento do Manus significa que a IA no modo Agente pode compreender os requisitos e trabalhar de forma independente até que a tarefa seja concluída. Este é sem dúvida um grande passo no campo da interação humano-computador e permite-nos ver o potencial da IA ​​para se transformar de uma ferramenta em um parceiro.

Mas ainda é muito cedo para dizer que temos um pé na porta da AGI. O próprio Xiao Hong também mencionou que o primeiro Agente era mais como uma “máquina funcional” e exigia constantes iterações e melhorias. O Agente atual ainda precisa contar com a melhoria das capacidades do modelo e um suporte mais completo ao ambiente virtual para ser realmente capaz de realizar diversas tarefas de cauda longa.

Se comparado com a condução inteligente, é provavelmente equivalente a passar do nível L2 para o nível L3 de condução assistida. Embora Manus tenha tido um bom desempenho no benchmark GAIA, isso não significa que tenha todas as características da inteligência artificial geral. O caminho para a AGI ainda é longo e requer a resolução de múltiplos desafios, tais como capacidades de modelo, aprendizagem autónoma e generalização de tarefas.

Mas devido ao avanço da Manus em autonomia e versatilidade, há outra estrela que nos ilumina na grande viagem à AGI.

# Bem-vindo a seguir a conta pública oficial do WeChat de Aifaner: Aifaner (WeChat ID: ifanr). Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo |