As mãos do mais recente robô humanoide da Xiaomi conseguem “suar”.
O produto mais surpreendente da Xiaomi nos últimos tempos não é um carro ou um telefone, mas sim um robô humanoide que ainda não foi lançado oficialmente: o Xiaomi CyberOne V2.
Fez sua primeira aparição pública na conferência de investidores da Xiaomi anteontem.

Ele não correu, nem pulou, nem deu uma cambalhota; simplesmente ficou ali parado em silêncio, como um funcionário bem treinado, entregando presentes aos convidados, apertando mãos e dando "high-fives".
A Xiaomi ainda não divulgou as especificações oficiais, mas, de acordo com vazamentos online, o robô humanoide Xiaomi CyberOne V2 tem 178 cm de altura e pesa aproximadamente 52 kg.

Outros parâmetros incluem a velocidade de caminhada do robô, que é de aproximadamente 0,98 m/s, e sua capacidade de elevação com um único braço, que pode suportar um peso de 3 kg. Em comparação, o robô Unitree H2, lançado anteriormente, possui uma velocidade máxima de caminhada de 3,3 m/s, uma carga máxima por braço de 15 kg e uma carga nominal de 7 kg.
O foco do Xiaomi CyberOne V2 claramente não é caminhar e levantar peso. A característica mais notável desta vez é a mão redesenhada do robô da Xiaomi.

Essas mãos são fabricadas em escala 1:1 da mão de um homem adulto, com 22 a 27 graus de liberdade. Elas podem não apenas executar tarefas em cenários industriais delicados, como apertar parafusos rapidamente e girar pinos na palma da mão, mas também beliscar penas e tocar balões.
Mais surpreendente ainda é que essas mãos também possuem glândulas sudoríparas humanas.
Outros vazamentos também mencionam que o Xiaomi CyberOne V2 utiliza um modelo de IA emocional para reconhecer expressões faciais e vozes, fornecendo assim feedback interativo adequado.
No entanto, alguns internautas americanos comentaram que o Xiaomi CyberOne V2 se parece muito com o Tesla Optimus, e Musk estava certo em não revelar nenhuma informação sobre o Optimus antecipadamente.

Musk havia declarado anteriormente que o atraso na apresentação do Optimus V3 visava impedir que os concorrentes o copiassem e que ele deveria ser mantido em segredo o máximo possível antes do início da produção em massa.
A destreza manual é o principal fator limitante para o desenvolvimento de robôs.
Do ponto de vista tecnológico e do mercado de capitais, o desenvolvimento da robótica tem sido muito rápido recentemente, com quase uma inteligência artificial recebendo financiamento todos os dias.
Com sua impressionante agilidade, o robô que completou a meia maratona quebrou o recorde humano, ultrapassando a marca de uma hora.
No entanto, quando se trata de "operação manual", tarefas como virar páginas ou amarrar cadarços, que são operações cotidianas para os humanos, ainda são um sonho distante para os robôs.

A essência da inteligência incorporada reside em como o cérebro de um robô interage com o mundo real através de seu corpo físico, e a destreza das mãos tornou-se o maior gargalo de hardware para alcançar uma interação perfeita.
Diversas empresas de robótica têm conduzido pesquisas sobre o problema das mãos hábeis. A BrainCo lançou anteriormente a mão inteligente háptica BrainCo Revo 3, que possui 21 graus de liberdade, integra feedback háptico em toda a palma da mão e feedback visual-háptico na ponta dos dedos, e é compatível com o ecossistema de código aberto.
No vídeo de demonstração oficial, essa mão ultrapassa a amplitude de movimento da mão humana e abrange 33 gestos de preensão diferentes. Ela consegue resolver cubos mágicos com ambas as mãos, usar tesouras e manusear terços, entre outras coisas.

O desafio de criar mãos hábeis reside no fato de que tanto o software quanto o hardware enfrentam impasses simultâneos. No que diz respeito ao software, os movimentos de uma mão humana precisam ser redirecionados para os de uma mão robótica; no que diz respeito ao hardware, é difícil que os pequenos atuadores dentro dos dedos sejam potentes, sensíveis e confiáveis ao mesmo tempo.
O termo "redirecionamento" aqui pode ser entendido como a conversão da postura, da trajetória da ponta dos dedos e da relação de contato de uma mão humana em ângulos articulares e comandos de controle que uma mão robótica pode executar.

No entanto, o tamanho, o número de articulações e a amplitude de movimento das mãos humanas e das mãos robóticas não são exatamente os mesmos. Ações que são naturais para os humanos podem se tornar inalcançáveis, atravessando objetos ou apresentando pontos de contato incorretos quando mapeadas diretamente em uma mão robótica.
Em termos de hardware, as juntas das pernas geralmente têm mais espaço, permitindo motores com raios maiores e densidades de torque mais altas, facilitando a adoção de relações de redução baixas ou soluções de acionamento quase direto. Por exemplo, uma relação de redução de 6:1 significa que, a cada 6 rotações do motor, o eixo de saída gira 1 rotação; a velocidade diminui, mas o torque de saída aumenta.

▲Motor da perna (relação de engrenagem: 6) e do dedo (relação de engrenagem: 288). O torque é proporcional a r³.
Os dedos não têm esse tipo de espaço. O motor precisa ser miniaturizado para um tamanho que caiba dentro de uma articulação do dedo e, sob condições geometricamente semelhantes, o torque do motor diminui aproximadamente com o cubo do comprimento característico. Se a dimensão linear for reduzida a 1/10, o torque poderá ser apenas da ordem de 1/1000 do original.
Quando o torque é insuficiente, uma abordagem comum é compensar com uma relação de redução maior, como 100:1, 200:1 ou até mesmo 288:1.
O custo de uma alta taxa de redução também é direto: atrito, folga, perda de eficiência e inércia refletida tornam-se mais difíceis de controlar. Um dedo que é muito ágil na simulação pode se tornar rígido e rombudo na realidade, sem suavidade no contato, dificultando a manipulação precisa.
De acordo com um artigo anterior da Xiaomi Technology que explorava a mão biônica háptica de palma completa, a fim de reutilizar totalmente os dados humanos, a Xiaomi também fez progressos significativos na reconstrução da mão biônica do CyberOne V2.
Biomimética definitiva em escala 1:1: O volume da mão biônica foi significativamente reduzido em 60%, com dimensões idênticas às de uma mão adulta masculina. Simultaneamente, ela possui 64% mais graus de liberdade, apresentando de 22 a 27 graus de liberdade (GDL), com alcance e distribuição de inércia quase idênticos aos de uma mão humana real.

Cobertura tátil completa da palma da mão: Se a visão de um robô estiver obstruída, ele essencialmente não consegue funcionar corretamente. A Xiaomi apresentou uma solução de luva tátil que aumenta a área de cobertura dos sensores táteis em toda a palma da mão para 8.200 milímetros quadrados. Humanos podem usá-la para prototipagem, e o robô pode herdar perfeitamente a "sensação" do toque.
150.000 ciclos de serragem duráveis: Em um laboratório ou vídeo de demonstração, apertar uma xícara é fácil, mas em uma fábrica, após 10.000 ciclos consecutivos de aparafusamento, os tendões, molas e mangas de um robô se romperão. A mão biônica da Xiaomi já ultrapassou 150.000 ciclos em aplicações reais de preensão.
O detalhe mais singular são as "glândulas sudoríparas" da mão hábil.
Para alcançar essa grande destreza nas mãos, a Xiaomi também teve que inserir diversos motores no antebraço único do robô.
Em aplicações práticas, um único motor pode gerar mais de 100 W de potência, dos quais 30 W são convertidos diretamente em calor residual, queimando facilmente a fiação. No espaço confinado sem um grande ventilador externo, eles se inspiraram no processo humano de "transpirar para dissipar o calor".
A Xiaomi utilizou impressão 3D em metal para criar um canal de circulação de refrigeração líquida em miniatura dentro de uma estrutura compacta para o antebraço. Uma microbomba transfere o calor, e o resfriamento é realizado por meio da evaporação da água, que absorve o calor e resfria o dispositivo.
Em testes reais, esse sistema biomimético de glândulas sudoríparas precisa evaporar apenas 0,5 mL de água por minuto para fornecer aproximadamente 10 W de dissipação de calor ativa.
Além das mãos, o robô também possui o cérebro.
O hardware está passando por iterações, e os modelos estão avançando em paralelo.
Há dois meses, a Xiaomi tornou público o código-fonte do Xiaomi-Robotics-0, um modelo VLA (Visão-Linguagem-Movimento) para inteligência incorporada.
Em um tweet oficial da Xiaomi Technology, eles também disponibilizaram gratuitamente o código-fonte de todo o processo pós-treinamento em um dispositivo real.

O dado mais intuitivo é que, com base no treinamento prévio, após 20 horas de treinamento em um dispositivo real com dados de tarefas, o modelo Xiaomi-Robotics-0 consegue aprender a tarefa complexa de "colocar os fones de ouvido no estojo" e armazenar vários fones de ouvido continuamente.
Um detalhe técnico importante nesse processo pós-treinamento é a solução para o "efeito da preguiça".
Para garantir movimentos suaves dos robôs, a indústria normalmente emprega raciocínio assíncrono e técnicas de "prefixação de ações", permitindo que novas ações façam a transição naturalmente a partir da inércia da ação anterior. No entanto, isso pode fazer com que a IA se torne "preguiçosa": dependendo excessivamente da inércia do movimento e ignorando seletivamente o feedback visual em tempo real das câmeras.
A Xiaomi utilizou três mecanismos para combater esse problema: perda ponderada adaptativa, máscara de atenção do tipo Λ e oclusão aleatória de ação prefixada. Simplificando, ela cria deliberadamente situações de "resposta incompleta" para o modelo durante o treinamento, forçando-o a analisar o sinal visual atual.

A integração de recursos de hardware e software permitiu que os robôs da Xiaomi já fossem utilizados em fábricas de automóveis. Na estação de instalação de porcas autoatarraxantes, eles alcançaram 3 horas de operação contínua e ininterrupta com uma taxa de sucesso de instalação de até 90,2%, e conseguem acompanhar o ciclo de alta velocidade da linha de produção em 76 segundos.
Robôs iniciam entregas em massa
Anteriormente, a Tesla interrompeu toda a linha de produção dos modelos S/X para dar lugar a robôs.
Durante a teleconferência de resultados do primeiro trimestre, Musk anunciou que a terceira geração do Optimus V3 deverá ser apresentada em meados do ano, com a produção começando entre o final de julho e agosto na fábrica de Fremont, na Califórnia, e as entregas para clientes corporativos no segundo semestre de 2026, com uma capacidade de produção anual planejada de 1 milhão de unidades.

Mas, como Musk admitiu em um podcast, a coordenação motora fina foi "a parte mais difícil de todo o projeto".
O Optimus da Tesla ainda não está em produção em massa, enquanto outra empresa americana de robôs humanoides, a Figure Robotics, anunciou hoje na X que expandiu sua escala de produção em 24 vezes, passando de um robô por dia para um robô por hora.

Em seu comunicado de imprensa oficial, a Figure mencionou que já entregou mais de 350 robôs.
Para a Xiaomi, fabricar robôs pode não ser tão rápido quanto para empresas como Figure, Unitree ou mesmo Tesla, que conseguem vender um único robô humanoide de uso geral para o consumidor final.
No entanto, a direção que o CyberOne V2 tomou também revela que o que a Xiaomi realmente quer resolver, além de fazer o robô correr mais rápido e levantar mais peso, é torná-lo mais parecido com uma mão que possa realmente trabalhar.

▲Vídeo do site oficial da empresa de robótica quantitativa, na qual a Xiaomi liderou o investimento.
Afinal, a capacidade dos robôs humanoides de entrar em fábricas e residências nunca foi determinada pela sua habilidade de dar cambalhotas, mas sim pela sua capacidade de apertar parafusos, recolher fones de ouvido, entregar objetos e realizar essas ações aparentemente simples, porém tão comuns no dia a dia.
E este é precisamente o passo mais próximo que os robôs humanoides estão da implantação em larga escala.
Algumas imagens foram obtidas da conta oficial da Xiaomi Technology no WeChat, X@niccruzpatane, e do site https://www.origami-robotics.com/blog/dexterity-deadlocks.html
#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

