Este robô aprendeu a sincronizar os lábios como humanos assistindo a vídeos no YouTube.
Pesquisadores da Columbia Engineering treinaram um robô com aparência humana chamado Emo para sincronizar os lábios com a fala e músicas, estudando vídeos online, demonstrando como as máquinas agora podem aprender comportamentos humanos complexos simplesmente observando-os.
Emo não é um corpo humanoide completo, mas sim um rosto robótico altamente realista, construído para explorar como os humanos se comunicam. O rosto é coberto com pele de silicone e controlado por 26 motores faciais independentes que movem os lábios, a mandíbula e as bochechas.
Esses motores permitem que Emo forme expressões faciais detalhadas, abrangendo 24 consoantes e 16 vogais, o que é fundamental para uma fala e um canto naturais. O objetivo era reduzir o efeito do vale da estranheza, em que robôs com aparência quase humana ainda causam desconforto porque seus movimentos faciais não correspondem à sua voz.
Como o Emo aprendeu a dublar como um humano
O processo de aprendizagem ocorreu em etapas. Primeiro, Emo explorou seu próprio rosto movendo seus motores enquanto se observava em um espelho. Isso ajudou o sistema a entender como os comandos motores alteram as formas faciais.
Em seguida, os pesquisadores introduziram um processo de aprendizado que conecta o som ao movimento. Emo assistiu a horas de vídeos do YouTube de pessoas falando e cantando, enquanto um modelo de IA analisava a relação entre o áudio e o movimento visível dos lábios.
Em vez de se concentrar na linguagem ou no significado, o sistema estudou os sons brutos da fala. Um transformador de ações faciais converteu esses padrões aprendidos em comandos motores em tempo real.
Essa abordagem permitiu que Emo fizesse dublagem labial não apenas em inglês, mas também em idiomas nos quais nunca havia sido treinado, incluindo francês, árabe e chinês. O mesmo método funcionou para o canto, que é mais difícil devido às vogais alongadas e às mudanças de ritmo.
Os pesquisadores afirmam que isso é importante porque os robôs do futuro precisarão se comunicar naturalmente para trabalharem ao lado de pessoas. Esse avanço chega em um momento em que o interesse por robôs para residências e locais de trabalho está crescendo rapidamente.
Na CES 2026 , esse ímpeto ficou evidente, com demonstrações que variaram do humanoide Atlas da Boston Dynamics, pronto para entrar no ambiente de trabalho, ao robô doméstico da SwitchBot, capaz de cozinhar e lavar roupa, e ao futuro robô assistente doméstico da LG, projetado para facilitar o dia a dia.
Com avanços como pele artificial que confere aos robôs sensibilidade semelhante à humana , e combinada com sincronização labial realista, fica fácil entender como os robôs estão começando a se parecer menos com máquinas e mais com companheiros sociais. Emo ainda é um projeto de pesquisa, mas demonstra como os robôs podem um dia aprender habilidades humanas da mesma forma que nós, observando e ouvindo.
O artigo "Este robô aprendeu a dublar como humanos assistindo a vídeos do YouTube" foi publicado originalmente no Digital Trends .

