Um robô capaz de realizar tarefas domésticas enquanto caminha foi descoberto, e um vídeo gravado em um único take, no qual ele limpa a sala de estar, viralizou no exterior.

Desde que o robô exibiu suas diversas habilidades musicais no Festival da Primavera, é difícil não imaginar o que vem a seguir: depressa, será que o lendário robô de tarefas domésticas consegue fazer ainda mais rápido?

Em março deste ano, a empresa de robôs humanoides Figure lançou um novo vídeo que não envolvia dança ou cambalhotas; simplesmente demonstrava suas habilidades em tarefas domésticas.

Um robô Figure 03 entra em uma sala de estar bagunçada, olha ao redor e começa a trabalhar: recolhe brinquedos do chão e os guarda em uma caixa, borrifa spray na mesa de centro e a limpa com uma toalha, ajeita as almofadas do sofá e as coloca de volta em seus lugares, e até pega o controle remoto e aperta o botão de ligar/desligar a TV. Todo o processo é realizado sem qualquer comando humano ou operação por controle remoto, e é filmado em uma única tomada contínua.

O vídeo rapidamente viralizou nas redes sociais. Comparado a várias demonstrações "legais" de robôs, ele faz coisas muito comuns — coisas que você não quer fazer depois de chegar em casa todos os dias, mas que precisa fazer mesmo assim.

Essa é exatamente a mensagem que a Figure quer transmitir.

Não se trata de um novo hardware, mas sim de um novo "cérebro".

Vale ressaltar que a Figure não está lançando um novo robô; o hardware permanece o mesmo do Figure 03, lançado em outubro passado. A atualização vem de um sistema de controle de IA completamente novo, o Helix.

A principal inovação do Helix 02 reside em um conceito: autonomia de corpo inteiro. Robôs humanoides anteriores, incluindo o próprio sistema Helix da Figure, da geração anterior, conseguiam controlar principalmente a parte superior do corpo; ser capaz de ficar parado e alcançar algo já era considerado um bom resultado. Ao se mover, o sistema precisava primeiro interromper os movimentos das mãos, estabilizar o corpo, dar um passo, parar novamente e então estender a mão mais uma vez.

Esse padrão "andar-parar-fazer-parar-andar" significa que, se um robô fizer alguma coisa, pode levar dez vezes mais tempo do que você levaria para fazer sozinho, o que é colocar a carroça na frente dos bois.

O Helix 02 simplificou completamente esse processo. Ele utiliza uma única rede neural para controlar simultaneamente a caminhada, o equilíbrio e a manipulação. O robô consegue andar enquanto carrega uma tigela, fechar uma porta com os quadris enquanto segura algo nas mãos e até mesmo abrir a porta da lava-louças com os pés quando as mãos estão ocupadas.

Isso soa como a ação mais natural que uma pessoa tomaria ao fazer tarefas domésticas, mas para robôs, é um problema que atormenta a academia e a indústria há décadas: a locomoção-manipulação, que é o controle unificado do movimento e da manipulação.

Nem mesmo Musk pôde deixar de perguntar: Será que é realmente autônomo?

Hardware projetado para a família

A arquitetura do Helix 02 é dividida em três camadas, que podem ser comparadas à forma como os humanos pensam:

O Sistema 2 (Pensamento Lento) é responsável pela compreensão semântica: observar a sala de estar, avaliar o que está desarrumado, onde deve ser guardado e o que fazer primeiro e o que fazer depois. Essa camada lida com o "entendimento" e o "planejamento".

O Sistema 1 (Pensamento Rápido) é responsável por traduzir a compreensão em ação: ele converte dados de todos os sensores, incluindo visão, tato e propriocepção, em posições-alvo para todas as articulações do corpo a uma frequência de 200 vezes por segundo. Essa camada lida com a "tomada de decisões".

O Sistema 0 (a camada instintiva) é a maior novidade desta vez. Ele opera a uma frequência de 1.000 vezes por segundo e é responsável pelo equilíbrio, contato e coordenação de todo o corpo. A Figure treinou esse controlador subjacente usando mais de 1.000 horas de dados de movimento humano e aprendizado por reforço em ambientes simulados. Nas palavras da Figure, essa rede neural de 10 milhões de parâmetros substituiu as 109.504 linhas de código C++ escritas à mão.

O resultado dessa estrutura de três camadas é que o robô não se parece mais com uma máquina executando instruções pré-programadas, mas sim com uma pessoa "fazendo tarefas domésticas" — seus movimentos são coerentes e rítmicos, e ocasionalmente ele toma algumas decisões aparentemente "inteligentes" de forma improvisada (como mover uma xícara para o lado para verificar se há manchas).

As capacidades do Helix 02 também são inseparáveis ​​do suporte da plataforma de hardware Figure 03. Este robô tem 1,68 m de altura (aproximadamente 5 pés e 8 polegadas), pesa 61 kg e pode operar por 5 horas com uma única carga. Comparado ao seu antecessor, o Figure 02, ele apresenta diversas mudanças importantes:

Câmeras e sensores táteis integrados nas palmas das mãos. Cada palma possui uma câmera grande angular embutida que fornece feedback visual de curto alcance quando a câmera principal está obstruída (por exemplo, ao alcançar algo dentro de um armário). A ponta de cada dedo possui um sensor tátil sensível o suficiente para detectar forças de apenas 3 gramas. Isso permite que o robô pegue com precisão um único objeto em meio a uma pilha de pequenos objetos espalhados e até mesmo dispense com precisão 5 mililitros de líquido com uma seringa.

O corpo inteiro é revestido com materiais macios. Não se trata mais de uma carapaça fria e metálica, mas sim de um tecido macio, removível e lavável, com espuma de múltiplas densidades estrategicamente posicionada para evitar lesões por beliscão.

Carregamento sem fio. Uma bobina de indução está embutida na sola dos pés; basta ficar em pé na base de carregamento para obter 2 quilowatts de carga. Não é necessária intervenção humana para conectá-lo à tomada; o robô pode caminhar até a estação de carregamento sozinho.

Esses detalhes apontam para um posicionamento claro do produto: a Figura 03 não é um protótipo de laboratório, mas um produto de consumo projetado para entrar no lar.

Quando foi lançado no final do ano, o Figure escolheu uma cozinha como cenário de demonstração, onde o robô completou autonomamente uma tarefa completa que durou 4 minutos.

Ele caminha até a máquina de lavar louça, abre a porta, retira a louça, vai até o armário para guardá-la, depois volta para colocar a louça suja, fecha a porta e liga a máquina. Todo o processo consiste em 61 movimentos consecutivos e ininterruptos. A Figura descreve isso como "a tarefa autônoma mais longa e complexa já realizada por um robô humanoide".

A demonstração de março levou a dificuldade um passo adiante, passando para a sala de estar. Embora a cozinha seja complexa, a disposição dos itens é relativamente fixa e os percursos são relativamente previsíveis. A sala de estar, no entanto, é um espaço que muda todos os dias.

Os brinquedos estão espalhados por diferentes lugares, as almofadas do sofá estão em estados variados e o número de xícaras na mesa de centro também. O comportamento físico dos objetos macios (toalhas, almofadas) é imprevisível. As passagens entre os móveis são estreitas, exigindo que se passe de lado. Muitas ações requerem o uso de ambas as mãos, enquanto outras exigem que uma das mãos fique temporariamente livre durante a execução da tarefa.

Além disso, esta demonstração também incorporou o uso de ferramentas — um borrifador e um pano, botões de controle remoto — exigindo que o robô não apenas entendesse "o que" era o item, mas também "como" usá-lo.

A figura destaca um ponto fundamental: da cozinha à sala de estar, o Helix 02 não alterou nenhum algoritmo nem realizou nenhuma otimização de engenharia específica; simplesmente aumentou os dados de treinamento. Utilizando a mesma arquitetura geral, o aumento da quantidade de dados permitiu que ele aprendesse novas habilidades.

Isso sugere uma extensão interessante: se arrumar a sala de estar exige apenas "assistir à demonstração mais algumas vezes", o que dizer de arrumar o quarto, organizar o guarda-roupa, regar as plantas e alimentar o gato? Há muito o que fazer!

Chegou realmente a "era dos robôs domésticos"?

Primeiro, despeje um balde de água fria sobre ele.

O preço estimado do Figure 03 está atualmente entre US$ 50.000 e US$ 100.000. Mesmo com o modelo de negócios proposto pela Figure, de robô como serviço, gerando aproximadamente US$ 5.000 em receita por robô por ano, esse preço ainda está muito além do alcance da família média. Além disso, sempre haverá uma lacuna entre os vídeos de demonstração e os ambientes domésticos reais.

Além disso, embora a sala de estar no vídeo pareça muito "comum", ainda assim é um ambiente controlado. Famílias reais têm animais de estimação, filhos, cantos cheios de caixas de entregas e pilhas de roupas que você não lavou há três semanas.

No entanto, de outra perspectiva, a importância do Helix 02 reside não na sua implementação imediata, mas na comprovação da viabilidade de um caminho: usar uma única arquitetura de IA de propósito geral + mais dados = mais habilidades domésticas.

Isso é semelhante à lei de escala de grandes modelos de linguagem. O ChatGPT não foi especificamente programado para escrever poesia ou código — ele simplesmente desenvolveu essas habilidades ao ser treinado com mais texto.

O Helix 02 demonstra a mesma lógica mapeada para o mundo físico: uma rede neural que não precisa ser reestruturada para cada nova tarefa, mas simplesmente requer mais dados de movimento.

Se essa lógica se confirmar, a velocidade evolutiva dos robôs humanoides não dependerá mais da quantidade de linhas de código escritas pelos engenheiros, mas sim da quantidade de tarefas domésticas que eles "observam". E a coleta de dados a partir de tarefas domésticas é justamente a mais fácil de escalar — afinal, todos geram esses dados em suas casas diariamente.

A fábrica da BotQ tem atualmente uma capacidade de produção anual de 12.000 unidades, com o objetivo de produzir um total de 100.000 unidades em quatro anos. Cada robô enviado é um terminal de aquisição de dados, e cada novo cenário encontrado em diferentes residências será transmitido de volta via transmissão sem fio de ondas milimétricas de 10 Gbps para se tornar material de treinamento para a próxima versão do Helix.

Nas palavras de Brett Adcock, o que os impede de começar a comercializar o produto não é a demanda — eles poderiam vender um bilhão de unidades hoje — mas sim o fato de a IA ainda não ser universal o suficiente. No entanto, a demonstração do Helix 02 em uma sala de estar os aproxima ainda mais desse objetivo de "universalidade".

Desde dançar até arrumar a sala de estar, o passo dado pelo Helix 02 pode estar mais próximo do futuro do que qualquer salto mortal. Os robôs não precisam mais provar o quão legais são; precisam provar o quão úteis são.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.