Será que a Hermès está substituindo a lagosta? A Hermès Agent, com suas 40.000 estrelas, é mais do que apenas uma alternativa ao OpenClaw.

No artigo anterior, que discutia como traduzir "Harness", um leitor comentou que poderia se chamar "Hermes".

Inicialmente pensei que fosse um trocadilho, mas descobri que existe mesmo um produto para agentes chamado Hermes, e ele está em primeiro lugar na lista de tendências do GitHub durante todo o mês, ostentando atualmente 48.000 estrelas.

Diferentemente do Agente Lagosta, que se tornou extremamente popular recentemente, Hermes é um assistente pessoal de IA dedicado, compatível com todos os sistemas operacionais e plataformas. A descrição de Hermes é "o agente que cresce com você".

Parece ser de altíssima qualidade, e é exatamente isso que torna o Hermes Agent único.

Possui uma estrutura de aprendizado contínuo integrada. O OpenClaw depende da modificação de arquivos de configuração para combinar múltiplos agentes e lidar com diversas tarefas complexas. O Hermes Agent é uma estrutura de agente único cujas capacidades continuarão a melhorar com o aumento do tempo de uso efetivo.

O problema que ele resolve é que, enquanto todos discutem o que um agente pode fazer, ninguém percebe que o agente não deixa nenhum rastro após ser usado. O Hermes Agent, por outro lado, agora consegue se lembrar de "quais métodos funcionaram".

Também existem muitas publicações nas redes sociais recomendando a Hermes Agent, com algumas pessoas dizendo que acabaram de trocar a OpenClaw pela Hermes e que foi a escolha mais sábia que já fizeram.

Algumas pessoas também compartilharam o "Hermes Orange Paper", afirmando que o Hermes Agent é um produto seriamente subestimado e uma das estruturas de agentes de IA de código aberto mais poderosas disponíveis atualmente.

O Hermes Agent foi desenvolvido pela equipe da Nous Research. Analisando o histórico de lançamentos no GitHub, desde a atualização V0.2.0 em meados de março até o lançamento da V0.8.0 ontem, cada atualização apresenta um grande número de commits e merges de código, bem como atualizações práticas de recursos, o que o torna um projeto de código aberto muito ativo.

▲Foi lançado inicialmente em 25 de fevereiro, https://nousresearch.com/releases

O método de anotações do LLM Wiki, compartilhado anteriormente por Karpathy, que utiliza grandes modelos de linguagem e a ferramenta de anotações Obsidian para construir a própria biblioteca de conhecimento e pesquisa, foi imediatamente adicionado às habilidades integradas do Hermes.

O Hermes Agent pode ser instalado não apenas em computadores, mas também em celulares Android através do emulador de terminal Termux. A configuração do modelo e do gateway é semelhante à do OpenClaw.

Vale ressaltar que o Claude ainda não "bloqueou" o recurso; ainda é possível configurar modelos grandes diretamente, fazendo login como membro Claude Pro ou superior. Além disso, o Hermes Agent também oferece seu próprio portal Nous, com acesso mediante assinatura.

▲O modelo Hermes 4 da equipe de pesquisa Nous

Hoje, a plataforma MiMo da Xiaomi anunciou oficialmente que " a Xiaomi MiMo se integrou à principal plataforma de agentes do mundo, a Hermes Agent, e está disponível gratuitamente por duas semanas. "

 Site oficial da Hermes Agent: https://hermes-agent.nousresearch.com

Por que o OpenClaw é um verdadeiro rival?

A essência do OpenClaw é extrair completamente nossa IA da janela de bate-papo e integrá-la ao trabalho, estudo e vida real para que ela execute tarefas de fato. Ele pode se conectar ao WeChat, WeChat Empresarial e Lark, executar comandos de terminal, controlar navegadores e nos ajudar a enviar e-mails, gerenciar agendas e muito mais.

No entanto, o OpenClaw tem uma desvantagem: ele não consegue aprender e evoluir automaticamente com o nosso uso diário.

A memória do OpenClaw é estática — escrevemos informações no arquivo de configuração, ele as lê, a sessão termina e ele as lê novamente na próxima vez. Ele não extrai ativamente nada do processo de execução, nem fará automaticamente a coisa certa na próxima vez só porque corrigimos algo uma vez.

Mesmo depois de usar todos os fluxos de trabalho uma vez, ainda precisamos relembrá-los, talvez agrupando-os em Habilidades ou lembretes específicos.

Embora já existam habilidades especializadas projetadas para dar ao OpenClaw capacidades de autoaprendizagem, o Hermes Agent se concentra em "entender você melhor quanto mais você o usa", desde o ciclo de aprendizado da arquitetura subjacente até o sistema de memória e a execução interna do agente.

O que torna o Hermes Agent especial é o fato de ser um ciclo de aprendizagem fechado.

Após a conclusão de cada tarefa, o Hermes verifica se o valor da execução é digno de registro. As condições que acionam o registro são específicas: a ferramenta é chamada mais de 5 vezes, ocorreu um erro durante a execução e foi corrigido automaticamente, o usuário fez correções ou um caminho sutil, porém eficaz, foi seguido. Se alguma dessas condições for atendida, um arquivo Skill será gerado no diretório ~/.hermes/skills.

Assim como outras habilidades amplamente utilizadas no mercado de habilidades, este documento gerado automaticamente fornece um fluxo de trabalho que você pode seguir diretamente na próxima vez. O nome, a descrição, as etapas e as chamadas de ferramentas envolvidas são todos claramente indicados. O formato segue o padrão aberto agentskills.io e, teoricamente, é compatível com diversos agentes e pode ser usado em ferramentas como OpenClaw, Claude Code e Cursor.

Os arquivos de habilidades não são fixos no código. O Hermes Agent os modificará se encontrar um caminho melhor durante execuções subsequentes. As modificações são feitas preferencialmente usando patches, que repassam apenas a string antiga e o conteúdo de substituição, em vez de reescrever o arquivo inteiro.

Há duas considerações por trás dessa escolha: uma sobrescrita completa pode facilmente destruir as partes originais em funcionamento, enquanto a aplicação de patches corrige apenas as partes problemáticas, tornando-a mais segura e consumindo menos tokens.

A memória é o problema mais difícil para os agentes resolverem.

Outra diferença em relação ao OpenClaw é o sistema de memória.

Há alguns dias, Milla Jovovich, a protagonista feminina de "Resident Evil", e o engenheiro Ben Sigman lançaram em conjunto o MemPalace, uma ferramenta de IA de código aberto para gerenciamento de memória, que recebeu mais de 23.000 estrelas no GitHub em dois dias.

Seu design é inspirado nas técnicas de memorização dos antigos oradores gregos, que colocavam o que queriam lembrar em diferentes cômodos de um edifício imaginário e entravam para recuperar o objeto quando necessário.

Todo o sistema é dividido em cinco camadas: Ala (projetos ou pessoas), Corredor (tipos de memória), Sala (tópicos), Armário (resumos compactados) e Túnel (citações entre tópicos). A MemPalace afirma que essa estrutura hierárquica, por si só, melhorou a precisão da busca de 60,9% para 94,8%.

O princípio fundamental do MemPalace é: a IA não deve ter permissão para decidir o que vale a pena lembrar. O julgamento da IA ​​é falho, portanto, é melhor armazenar tudo e deixar que a recuperação determine o que é útil.

No incidente do vazamento de 500.000 linhas de código do Claude Code no início deste mês, outra solução para problemas de memória recorreu à inteligência artificial. Alguns internautas descobriram que o Claude usa uma abordagem semelhante à dos sonhos, utilizando o Auto Dream para organizar automaticamente nossos arquivos de memória.

O sistema de memória de Hermes também foi especialmente projetado, consistindo em quatro camadas, cada uma responsável por diferentes tarefas e acessada em momentos distintos.

A primeira camada é chamada de memória de dicas persistente. Dois arquivos, MEMORY.md e USER.md, armazenam o contexto que precisa ser carregado automaticamente no início de cada sessão. O limite total de caracteres é de apenas 3575; esse número é intencionalmente reduzido pelo Agente Hermes para nos forçar a filtrar em vez de incluir tudo.

A segunda camada é o arquivo de sessão. Cada conversa é gravada em um banco de dados SQLite e recuperada usando um índice de texto completo. Quando o Agente Hermes precisa de contexto histórico, ele inicia proativamente uma consulta, realiza um resumo LLM nos resultados da pesquisa e insere apenas as partes relevantes para a tarefa atual.

▲Link para o documento: https://hermes-agent.nousresearch.com/docs/user-guide/features/memory

A terceira camada é o arquivo de habilidades, que é o resultado do ciclo de aprendizado mencionado anteriormente. Por padrão, o sistema exibe apenas o nome e uma breve descrição da habilidade, e o texto completo é carregado sob demanda. O efeito desse design é que a biblioteca de habilidades pode crescer de 40 para 200 habilidades, enquanto o custo contextual permanece praticamente inalterado.

A quarta camada, chamada Honcho, é uma camada opcional de modelagem de usuário que acumula passivamente suas preferências, estilos de comunicação e conhecimento de domínio ao longo das conversas. É adequada para cenários em que o Hermes Agent é usado a longo prazo como um assistente pessoal diário.

A divisão de trabalho entre essas quatro camadas também é muito clara: se algo precisa aparecer em todas as conversas, coloque na primeira camada; se só é útil quando aparece em um tópico específico, deixe na segunda camada para recuperação; se é um processo operacional reutilizável, deixe a terceira camada lidar com ele; se é um perfil de usuário de longo prazo, entregue à quarta camada.

Quando uma mensagem chega ao Agente Hermes, seja ela proveniente de um gateway de terceiros como o Telegram ou da linha de comando, ela entra no mesmo mecanismo de execução síncrona: gerando um ID de tarefa, construindo prompts do sistema a partir da camada de memória, priorizando a reutilização de versões em cache para evitar construções duplicadas, verificando se o comprimento do contexto está próximo do limite antes do envio e chamando o modelo.

▲Fonte da imagem: https://mranand.substack.com/p/inside-hermes-agent-how-a-self-improving

Além de usar um ciclo de aprendizado para atualizar automaticamente durante a execução da tarefa, o Hermes também aciona um mecanismo chamado "Ajuste Periódico" no meio de cada sessão.

Sem intervenção do usuário, o sistema envia periodicamente e automaticamente um aviso interno ao agente, solicitando que ele revise as operações recentes e determine quais delas valem a pena serem gravadas na memória. Essa ação é inteiramente iniciada pelo usuário; o Agente Hermes decide o que reter.

Qual o custo para começar a trabalhar como Agente Hermès?

Semelhante à instalação do OpenClaw, isso pode ser feito com um único comando no Linux, macOS e WSL2, e também é compatível com dispositivos Android usando o Termux.

Hermes mencionou que não oferece suporte nativo ao Windows, então precisamos instalar o WSL2, Subsistema Windows para Linux, ou WSL para abreviar, que é uma camada de compatibilidade que permite que executáveis ​​binários nativos do Linux sejam executados no Windows.

O comando de instalação lida automaticamente com diversas dependências, incluindo configurações para Python 3.11, Node.js v22, ripgrep, ffmpeg, ambientes virtuais, comandos globais e LLM. A interface após a instalação é semelhante a ferramentas de terminal como o Claude Code, permitindo a interação com o Agente por meio de comandos específicos.

Em termos de configuração de modelos, existe uma ampla gama de provedores de serviços de inferência para escolher: Nous Portal (baseado em assinatura, configuração zero), Anthropic (usando diretamente o Claude, que pode ser autorizado com uma chave de API ou código Claude), OpenRouter, DeepSeek, Hugging Face, Alibaba Cloud DashScope (série Qwen), GitHub Copilot e qualquer interface compatível com OpenAI, incluindo modelos Ollam locais.

A Xiaomi também oferece a série MiMo-V2, incluindo o MiMo-V2-Pro, que suporta milhões de tokens de contexto, o MiMo-V2-Omni, com recursos completos de compreensão modal, e o modelo Flash. A Xiaomi também oferece um período de teste gratuito de duas semanas, de 8 a 22 de abril, permitindo que os usuários atualizem o Hermes Agent para a versão mais recente e acessem gratuitamente os principais modelos da Xiaomi por meio do Portal Nous.

O Hermes Agent também possui um módulo de Modelos Auxiliares, que é um conjunto de configurações de modelos leves no Hermes, especificamente para lidar com "tarefas secundárias". Eles não são responsáveis ​​pelo diálogo principal, mas sim por muitas tarefas críticas e de alta frequência que não justificam ocupar o modelo principal.

Por exemplo, diferentes tarefas como análise de imagem, extração de páginas web, correspondência de habilidades e processamento de memória serão automaticamente atribuídas a modelos diferentes. Por padrão, as tarefas auxiliares detectarão e priorizarão automaticamente o uso do Gemini Flash, sem a necessidade de configuração manual.

Isso é semelhante ao recurso de consultoria que a Anthropic lançou hoje, ambos sendo mecanismos adequados para situações em que o modelo principal é custoso, mas você deseja transferir tarefas periféricas para modelos mais baratos. O Hermes, por outro lado, tornou a "orquestração multimodelo" uma parte essencial de sua arquitetura subjacente.

Em relação às plataformas de mensagens, a lista de serviços suportados é semelhante à do Openclaw, enquanto Telegram, Discord, Slack e Lark estão entre as mais completas em termos de recursos, suportando diversos formatos, como voz, imagens e arquivos. Um único processo de gateway conecta todas as plataformas, proporcionando um gerenciamento unificado de sessões.

O Hermes Agent não é exatamente uma ferramenta que pode ser instalada em poucos minutos e colocada em uso rapidamente; trata-se mais de uma infraestrutura que precisamos executar e manter.

Se simplesmente quisermos um assistente de IA que possa ser controlado por meio de mensagens em um celular, o OpenClaw seria uma abordagem mais simples: basta escrever um arquivo de configuração SOUL.md, executá-lo, conectá-lo ao Telegram e pronto.

O Hermes Agent é adequado para cenários com fluxos de trabalho repetitivos e em constante evolução, nos quais desejamos que o agente acumule experiência com base em seus hábitos de uso. Esperamos que o agente, três meses depois, seja diferente do agente no primeiro dia.

Nas redes sociais, alguns internautas compartilharam exemplos de aplicação do Hermes Agent, incluindo automação de negócios, que conecta o sistema de gestão de relacionamento com o cliente (CRM) e a base de conhecimento de uma empresa; gestão de marketing, que automatiza a geração de conteúdo e a publicação em plataformas de mídia social; e projetos clássicos de engenharia de software, como geração de código.

À medida que aplicamos essas tecnologias em diversos cenários de negócios do mundo real, um fato inegável é que os agentes estão penetrando rapidamente nos ambientes de produção reais.

Em relação ao Hermes, alguns dizem que é apenas uma "alternativa leve" ao OpenClaw, enquanto outros o veem como uma evolução dos sistemas de agente único. Independentemente disso, a evolução dos agentes nunca cessará dentro da estrutura estabelecida pelo OpenClaw.

Seja Hermes ou OpenClaw, todas as soluções de agentes de código aberto atuais ainda apresentam suas próprias limitações. Provavelmente, ainda não surgiu a forma que permitirá que os agentes realmente se popularizem e se tornem parte da infraestrutura cotidiana das pessoas comuns.

Resolver o complexo sistema de memória apresenta enormes desafios de segurança para a IA. Dar membros à IA exige descobrir como acorrentá-la, e a instalação do Harness é muito complicada e tem uma barreira de entrada elevada, aparentemente impondo diversas limitações.

Pode-se afirmar que Hermes realmente deu ao Agente uma nova direção desta vez. Transformou o Agente de uma ferramenta descartável em um parceiro capaz de aprender com os erros e reter as lições.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.