Comece com o Button Space: um estagiário de IA que se “alinhará” ativamente com você

Agente (inteligente) e MCP (Model Context Protocol) são as tendências mais quentes no campo de IA no primeiro semestre de 2025.

Há alguns dias, o produto Agent da Byte , "Button Space", também iniciou oficialmente os testes internos.

Entre a multidão de produtos de agente, o Kouzi Space oferece pela primeira vez um "modo de planejamento" – um recurso de agente que pode colaborar com os usuários passo a passo, pausar e confirmar em nós de etapa chave e permitir que os usuários corrijam rotas em tempo real.

A Button Team acredita oficialmente que a colaboração entre pessoas e agentes criará um modelo de trabalho mais tranquilo.

Aplicativo beta interno do Button Space

Site oficial

Ai Faner também obteve o código de convite do espaço do botão imediatamente e experimentou algumas tarefas que eram um pouco imaginativas.

Atuamos como diretores de relações públicas de "Olá professor, meu nome é colega de classe He" e pedimos aos estagiários que analisassem os eventos recentes da opinião pública, gerassem um relatório de opinião pública, fornecessem contramedidas e sugestões e, em seguida, escrevessem uma declaração de resposta:

Dica: Sou o diretor de relações públicas da equipe 'Olá professor, meu nome é Sr. He'. Recentemente, nossa marca enfrentou um incidente de opinião pública. Por favor, colete informações, avalie o impacto do incidente, entenda o conteúdo das reclamações dos internautas e analise e extraia os erros que os internautas acham que cometemos e a direção para melhorias. Poderá pesquisar informação através dos sites e plataformas de Internet que considere apropriados. Em seguida, foi gerado um relatório de opinião pública para mim, que exibiu de forma abrangente o cronograma, o contexto de desenvolvimento, as reações e reclamações dos internautas e as estratégias de resposta deste incidente de opinião pública. O relatório precisa de ser um pouco mais aprofundado, especialmente para fornecer uma variedade de perspectivas diferentes sobre estratégias de resposta. Além disso, também preciso que você gere uma declaração de resposta baseada em sua estratégia de resposta que seja sincera, não fuja da responsabilidade e tenha medidas práticas de melhoria. Você precisa gerar o relatório de opinião pública em uma página da web e um arquivo pdf, e a declaração de resposta em um documento normal.

Esta tarefa parece relativamente simples. As principais ações são a pesquisa e a geração de texto, mas também exige que o produtor do relatório tenha conhecimento profissional de análise da opinião pública e a capacidade de refinar e formatar reportagens de mídia e postagens em mídias sociais em reportagens sérias. Estas são as capacidades de um produto de agente em termos de modelos grandes.

Além dos recursos do modelo em grande escala, esta tarefa também permite que o Button Space “teste seus recursos” em termos de uso de navegador/computador, código, MCP e outros recursos.

e padrões de trabalho. Esta é a parte da análise de dados do relatório de opinião pública gerado pela primeira vez:

Esta é uma estratégia de enfrentamento escrita por um estagiário de IA:

Sendo um “primeiro rascunho”, esta entrega cumpre os padrões em termos do nível de detalhe do relatório de opinião pública, da repartição lógica, do profissionalismo da análise e do formato da declaração de resposta. Os detalhes específicos podem não se aplicar necessariamente a um cenário do mundo real, mas pelo menos os resultados gerados fornecem orientações que podem ser utilizadas para os próximos passos.

Vale ressaltar que como o conceito de “linha do tempo” foi mencionado ao entrar na tarefa, os resultados gerados pareciam focar mais em eventos de pré-encomenda, como “plágio de projetos de código aberto” e “teclado que pode digitar sozinho”. E essa não é a intenção da nossa missão.

Obviamente, o alinhamento de metas entre colegas ainda é importante no local de trabalho.

Podemos apenas usar o modelo de planejamento do Button Space para nos alinhar com este estagiário de IA:

Após o alinhamento, não apenas a meta de conteúdo está correta, mas também a parte dos dados do relatório de opinião pública exibe diretamente a comparação do número de fãs, “taxa de três consecutivas” e taxa de conclusão. O poder explicativo e a representatividade dos dados foram aprimorados:

Você também pode visitar este link para ver o replay completo da missão.

Pare e desacelere: os parceiros de trabalho de IA precisam aprender a “alinhar-se”

A julgar pelos resultados dos testes do Aifaner, a maior diferença entre o Button Space e os produtos tradicionais de agente inteligente/MCP está neste modo de planejamento que pode "parar e desacelerar".

Simplificando, depois que o MCP recebe uma tarefa, ele decompõe automaticamente a tarefa em um plano especificado e, em seguida, começa a executar a tarefa e, finalmente, gera resultados. Mas é inevitável que “um passo errado leve a um passo errado”.

Depois que o espaço do botão ativa o modo de planejamento, ele pode “parar” e se alinhar com os usuários nos nós principais na execução de tarefas complexas, permitindo aos usuários corrigir erros e desvios em tempo real e otimizar a lógica de execução.

Este método é especialmente adequado para usuários novatos que não têm a capacidade de solicitar engenharia. Ao enviar uma tarefa pela primeira vez, simplesmente declare suas intenções de forma breve e concisa.

Existem duas condições de acionamento para o "Modo de planejamento":

  • Uma delas é que o agente não consegue concluir a etapa atual por vários motivos (por exemplo, não consegue encontrar informações relevantes ou não consegue entender com precisão a intenção do usuário) ou a confiança do resultado não é alta o suficiente – ele irá parar por conta própria. Quando a tarefa for suspensa, uma notificação aparecerá no espaço do botão para lembrar o usuário de realizar a próxima etapa.

  • A outra é que o usuário pode pressionar ativamente o "botão de pausa": durante a execução passo a passo da tarefa pelo agente, os resultados passo a passo serão gravados em um documento .md, que é usado para construir uma base de conhecimento e auxiliar na próxima etapa de execução. O mesmo se aplica ao Button Space. Se os usuários encontrarem erros ou desvios no documento passo a passo, eles próprios poderão pausar a correção.

Este fluxo de trabalho colaborativo do agente permite que o agente evite se desviar da meta definida por diversos motivos, como "análise errada no início" e alucinações causadas pelo pensamento e pela produção contínua de tokens.

Pode ser entendido desta forma: Se o grande modelo/agente tradicional é "direção autônoma", então o espaço do botão realmente permite que os usuários desempenhem o papel de "copiloto" (copiloto) da IA. Assim que o usuário perceber o desvio, ele pode acionar imediatamente os freios e corrigir manualmente o volante.

Se usarmos a analogia de um estagiário, Button Space é um estagiário de IA que pode “fazer perguntas a qualquer momento se não entender” e então ajustar com flexibilidade a direção do trabalho com base no feedback em tempo real.

Na verdade, existe mais de um estagiário de IA, mas pode haver muitos:

  • Para tarefas rotineiras, como processamento de texto, gráficos, análises simples, etc., o próprio Button Space é um estagiário geral. Pode ser considerado um “pequeno guerreiro hexágono” com capacidades relativamente abrangentes, mas não enfatiza campos especializados;
  • Quanto às tarefas em campos profissionais aprofundados, como pesquisa de usuários, pesquisa do setor financeiro, etc., os agentes "especialistas em domínio" são obrigados a se apresentar.

Seja um agente de uso geral ou especialista, pode ser agendado em uma parada através do “Button Space”.

Além disso, se os agentes especialistas existentes não forem suficientes, os desenvolvedores também podem fazer uso completo da plataforma de desenvolvimento Kouzi (desenvolvimento de agentes baseado em zero), Kouzi Compass (ferramenta de ajuste de agente DevOps) e Eino (estrutura de desenvolvimento de agente de linguagem Go) lançada simultaneamente pela equipe Kouzi para desenvolver e colocar rapidamente seus próprios agentes especialistas no mercado.

Estagiário de IA finalmente tem cérebro

É claro que na maioria dos testes de Aifan'er, o Button Space conseguiu entender a intenção com mais precisão e gerar resultados de alta qualidade.

A guerra tarifária tem estado muito viva recentemente, por isso também deixámos que ela tentasse este difícil problema: rastrear os níveis tarifários dos EUA nas principais categorias de importação para a China.

Alerta: A política tarifária do governo dos EUA tem mudado dia a dia recentemente. Preciso que você crie um formulário online que possa ser atualizado em tempo real para acompanhar as alterações nas tarifas desde 1º de abril. Você precisa acompanhar as alíquotas dos principais produtos exportados da China para os Estados Unidos, como equipamentos eletrônicos de consumo, seringas, brinquedos, etc. Se você não conseguir descobrir, pare e me pergunte a qualquer momento. Observe que algumas categorias tarifárias foram adicionadas recentemente, mas algumas categorias tarifárias existiam antes de 2025. Você precisa mostrar como as diferentes categorias tarifárias se comparam na tabela. Se você não entende, fique à vontade para me perguntar.

Vamos dar uma olhada nos resultados gerados primeiro:

Ai Faner observou o processo de pensamento e descobriu que ele tinha uma compreensão completa de conceitos complexos como “tarifas”, e isso pode estar relacionado ao grande modelo usado por trás dele.

No último mês, usamos muitas ferramentas de agente/MCP, especialmente alguns produtos com recursos de pesquisa profundos que afirmam ser capazes de executar tarefas complexas em nome dos usuários. Ao lidar com a mesma tarefa, eles precisam fazer dezenas de rodadas de pesquisas. Parece que eles estão se esforçando muito para entender o que o usuário está dizendo, dando às pessoas a sensação de estar usando muita força, mas os resultados não são os ideais.

Houve apenas seis rodadas de reflexão no Button Space, das quais apenas quatro foram realmente usadas para pesquisar e entender os tipos de tarifas (as duas rodadas restantes foram planejamento e alocação no início da tarefa, e geração de páginas da web no final da tarefa).

Os resultados gerados ainda são muito convincentes do ponto de vista visual.

E pode-se ver que este estagiário de IA não apenas apontou onde acertar, mas usou seu cérebro até certo ponto e fez algumas análises de dados que não estavam dentro dos requisitos iniciais da tarefa, mas que ele achou que seriam úteis. Por exemplo, o cronograma para aumentos e reduções tarifárias este ano está listado:

Foi realizada uma análise do impacto no curto, médio e longo prazo:

Existe também um método de apresentação estruturado que combina gráficos e texto:

E o que mais me surpreende: capta as diferenças e sobreposições de diferentes itens tarifários, como a linha de base, o “dia da liberdade” e a “equivalência” de 25 anos atrás.

Mas os erros também são muito fáceis de detectar, tais como as taxas de imposto na maioria das categorias serem calculadas completamente erradas. Quanto ao motivo do erro, meu entendimento é que o estagiário utilizou um método puro de busca de notícias e foi facilmente influenciado por informações incorretas e inoportunas, em vez de obter dados diretamente do site do governo dos EUA.

Claro, mesmo um estagiário de verdade provavelmente faria isso. Somente os profissionais de importação e exportação e os especialistas em tarifas sabem como obter os valores mais oportunos e precisos. Essa tarefa exige conhecimento e experiência profissional muito além do nível de um estagiário.

Mas isso não significa que o Button Space não possa resolver este problema: depois de ativar o "modo de planejamento", podemos fornecer uma definição clara da fonte de dados ao corrigir erros e deixá-lo chamar ativamente python/MySQL ou outros recursos de codificação para rastrear os dados mais precisos e reais; ou também podemos baixar manualmente relatórios com formato e conteúdo não otimizados de fontes confiáveis ​​e, em seguida, usar o plug-in de extensão de tabela multidimensional com suporte oficial para gerar a base de conhecimento necessária para a tarefa.

Kouzi Space suporta chamadas de ferramentas MCP externas (versão oficial) e atualmente suporta mais de dez extensões MCP internas e externas da ByteDance (como Moji Weather, Amap, etc.). Portanto, em teoria, os fornecedores profissionais de bancos de dados na indústria de importação e exportação também podem desenvolver suas próprias extensões MCP e integrá-las ao espaço de botões. Por mais complicado e absurdo que seja o progresso tarifário, os estagiários não podem ser incomodados.

Veja a repetição da tarefa tarifária on-line

Aqui está outra pequena tarefa de código puro, que pode ser um pouco exagerada. Deixe o espaço do botão criar uma impressora Olá mundo e modificar os requisitos no meio do caminho.

Líderes que ainda não sabem programar não precisam se preocupar com a fuga de seus funcionários: você também pode pedir a estagiários de IA que lhe ensinem como codificar.

Veja a repetição da tarefa de código on-line

Os testes anteriores foram todos baseados no "estagiário universal" ativado por padrão no Button Space.

Há também uma entrada para "Agente Especialista" na página inicial. Atualmente, dois especialistas disponíveis estão abertos na fase beta, nomeadamente o especialista em pesquisa de usuários (desenvolvido oficialmente por Kouzi) e o assistente de observação Huatai A-share (desenvolvido em conjunto por Huatai Securities e Kouzi).

Veja o Assistente de Observação A-share como exemplo. Sua interface de entrada é um pouco diferente daquela de um estagiário geral. Ele permite que os usuários personalizem relatórios diários com base em ações e setores selecionados. Também suporta funções de consulta individual, transformando o agente em um analista de valores mobiliários de uso exclusivo do usuário.

Esses dois agentes especializados também são um reflexo direto das capacidades de expansão do espaço de botões do MCP. Ele pode colocar o grande modelo do Button e os grandes modelos de recursos de provedores de serviços terceirizados no mesmo contexto para obter "colaboração" entre servidores MCP.

Quando a IA passa de “ferramenta” a “parceira”: humanos e máquinas não dividem o trabalho, mas evoluem simbioticamente

O limite de capacidade dos produtos e ferramentas tradicionais de grandes modelos determina que seu objetivo principal seja lidar com o trabalho transacional e substituir o trabalho repetitivo (por exemplo: geração de texto, classificação e formatação de dados, planejamento básico, etc.); e como mencionado anteriormente, os agentes/MCP integram a capacidade de pensamento aprofundado, desmontagem e planejamento de tarefas e execução automatizada passo a passo de tarefas, mas essa abordagem "totalmente automatizada" ainda tem desvantagens.

Comparado com os dois primeiros, o Kouzi Space propõe uma ideia nova: num ambiente onde todo o processo é supervisionado em tempo real por utilizadores reais, a IA pode estar profundamente envolvida no fluxo de trabalho completo de resolução de problemas e realizar o trabalho colaborativo orgânico de agentes humanos e inteligentes.

“Estagiário de IA” é realmente uma analogia interessante. Ao trabalhar com você, ele aprende com você, gradualmente se familiariza com seus hábitos e requisitos de trabalho e domina sua motivação de propósito e lógica de pensamento. Todo excelente mentor espera que seus estagiários possam se transformar em funcionários em tempo integral, responsáveis ​​por seus próprios assuntos, e esse tipo de crescimento só pode ser alcançado gradualmente por meio de métodos de trabalho inteligentes e da entrega contínua de resultados.

Ferramentas são constantemente introduzidas e a forma como trabalhamos está se tornando interessante por causa da IA. Mas, em última análise, entregar resultados de forma eficiente e estável é o caminho a seguir.

De outra perspectiva, quando as capacidades e a obediência das ferramentas de IA são melhoradas simultaneamente, cada trabalhador no local de trabalho pode convocar o seu próprio estagiário de IA a qualquer momento, e tarefas cada vez mais complexas e difíceis podem ser facilmente resolvidas. Para onde irão os próprios trabalhadores?

Talvez isto seja tanto um sinal de alerta como uma oportunidade, lembrando-nos que devemos transferir a nossa energia e o nosso tempo para os dois aspectos seguintes: primeiro, melhorar a nossa capacidade de controlar as ferramentas de IA; segundo, focar no trabalho criativo e reflexivo que nunca poderá ser substituído pela IA.

Afinal, no local de trabalho, o que escasseia nunca é a capacidade de fazer as coisas, mas sim o pensamento original.

É claro que esse futuro levará tempo para ser concretizado. Você pode se inscrever para a qualificação de experiência no Kouzi Space agora e deixar seu estagiário de IA/parceiro de local de trabalho digital experimentar primeiro.

Talvez a maneira como você trabalha e a qualidade de sua vida no local de trabalho sofram grandes mudanças.

# Bem-vindo a seguir a conta pública oficial do WeChat do aifaner: aifaner (WeChat ID: ifanr). Conteúdo mais interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo