A segunda geração do robô humanóide Tesla está aqui! Esmague um ovo com as mãos, faça agachamentos e dance, parece mais uma pessoa real
Silenciosamente, Tesla lançou hoje uma nova geração de robô humanóide Tesla Optimus Gen 2.
Em uma frase, o ponto-chave é que, em comparação com a geração anterior, o Optimus Gen 2 é mais humano, os principais pontos de atualização são resumidos da seguinte forma:
- Os atuadores e sensores recém-projetados da Tesla melhoram a eficiência e a precisão da execução de tarefas
- O pescoço acionado por 2-Dof (grau de liberdade) permite que a cabeça gire mais livremente
- As articulações manuais 11-Dof tornam o movimento das mãos mais flexível
- Integre atuadores com componentes eletrônicos e chicotes elétricos para melhorar a estabilidade geral do sistema
- Aumentar a velocidade de caminhada em 30%, melhorando a adaptabilidade ambiental
- Apresentando detecção de força/torque no pé para adaptação flexível às condições do solo
- 10kg mais leve e mais manobrável
Como pode ser visto no vídeo postado por Musk, o Optimus Gen 2 pode andar suavemente, com uma velocidade de caminhada 30% mais rápida que a geração anterior, também pode agachar-se a cerca de 90 graus e o grau de controle dos membros é bastante bom. .
O Optimus Gen 2 também foi atualizado com uma mão totalmente nova. A mão com 11 graus de liberdade permite-lhe tremer como uma mão humana, e a precisão e suavidade dos movimentos são como as de pessoas reais.
O Optimus Gen2 possui sensor tátil em todos os dedos, permitindo-lhe manusear com destreza itens frágeis como ovos e parecer que pode cozinhar.
No final do vídeo, você também verá dois Optimus Gen 2 dançando juntos ao ritmo da música e das luzes ofuscantes. Este também é um pequeno ovo de Páscoa enterrado por Tesla.
Um engenheiro sênior da Tesla disse que tudo no vídeo era real e não foi gerado usando CGI, então as ações eram todas em tempo real e não aceleradas. Ele também elogiou o robô Tesla por suas incríveis melhorias no desempenho do hardware.
Se o que ele disse for verdade, então a evolução do robô humanóide de Tesla fica clara à primeira vista
▲Foto de @Hanteta_
A jornada evolutiva dos robôs Tesla
Passaram-se apenas três anos desde que Tesla lançou seu primeiro robô humanóide, mas ele deu início a uma rápida evolução.
No AI Day em agosto de 2021, Musk anunciou oficialmente o robô humanóide Tesla Tesla Bot. O robô foi projetado para ter 1,80 metro de altura e pesar 125 quilos, com capacidade de carregar 45 quilos e levantar 150 quilos, e é usado principalmente para realizar tarefas consideradas perigosas, repetitivas e chatas.
Mas naquela época, esse robô era apenas algumas imagens conceituais de PPT que “viviam” na tela, e até mesmo a aparência da dança no palco era completada por um homem vestindo uma fantasia de robô.
Então, na conferência AI Day 2022 do ano seguinte, o protagonista mudou completamente: o Optimus Robot, que caminhou para a frente do palco, tornou-se o protagonista mais forte da conferência naquele dia.
A estrutura mecânica exposta torna sua aparência um pouco áspera, mas seja movendo caixas, regando plantas ou movendo tijolos na superfábrica, o “Optimus Prime” no vídeo de demonstração pode dar muito trabalho.
O que fornece energia a este Optimus Prime não é o fogo, mas sim uma bateria com capacidade de 2,3 kWh, totalmente protegida e colocada no centro do corpo, que é o azul da imagem.
Na altura, Musk disse que o Optimus Prime era “muito adequado para um dia inteiro de trabalho”. Algumas pessoas podem perguntar o quão rápido é caminhar, cerca de 2 metros por segundo.
Para garantir a flexibilidade do Optimus Prime, Tesla até projetou 28 juntas para ele. Cada junta possui vários conjuntos de atuadores. Esses atuadores podem analisar a eficiência da execução em segundo plano e reduzir o trabalho ineficaz.
Tesla disse que todo o Optimus Prime tem mais de 200 graus de liberdade, e seus ponteiros representam 27 deles. Eles são acionados por um atuador. Através do sistema visual e algoritmo, o Optimus Prime pode identificar com precisão a mão e a localização do o objeto para completar as tarefas de regar flores e pegar os objetos mencionados acima.
"Optimus Prime" levou cinco meses para dar o primeiro passo e se mover livremente em várias poses.
Durante o período de investimento da Tesla em março deste ano, a Optimus mais uma vez inaugurou uma evolução épica. Um dos destaques foi quando o Optimus pegou um braço robótico da mesa e o fixou no lugar, enquanto outro Optimus o fixou no terceiro Optimus que ainda estava sendo montado. Uma execução de tarefa tão ágil e suave, muito melhor que o Ability original fez progressos substanciais.
Naquela época, os movimentos do Optimus ainda eram relativamente rígidos e ele ainda não conseguia completar movimentos complexos como o parkour, mas inicialmente demonstrou habilidades universais, como caminhar distâncias curtas de forma independente, carregar objetos e usar ferramentas básicas.
Apenas meio ano depois, no AI Day, em setembro, a Optimus não só conseguiu separar os blocos por cor, como também ergueu os braços com confiança e depois fez uma pose de ioga numa perna, mostrando excelente equilíbrio e coordenação.força.
Agora, como mencionado acima, com o seu corpo realista, dedos ágeis e marcha suave e leve, o Optimus Gen 2 está mais próximo dos níveis humanos em termos de movimento e capacidades de operação. Talvez num futuro próximo, o Optimus, mais móvel, seja capaz de replicar movimentos humanos complexos, como "rastejar, saltar, agarrar e levantar".
Claro que, de acordo com a visão de Musk, o objectivo a longo prazo da Optimus não é apenas substituir humanos em tarefas como trabalho repetitivo e operações perigosas, mas tornar-se num robô de serviço geral que possa ser integrado em cenários mais complexos, como casas, escritórios, e cenas comerciais.
Portanto, o hardware do robô é apenas a pedra angular. Uma inteligência humanóide completa também requer software de nível "cérebro" e capacitação de algoritmo.
O que acontece quando você coloca o GPT-4 em um robô humanóide?
Desde o início deste ano, com a atualização iterativa contínua de grandes modelos e a rápida melhoria das capacidades de generalização inteligente, as pessoas têm visto as perspectivas potenciais dos robôs humanóides.De tempos em tempos, veremos alguns novos jogadores entrando na trilha dos robôs humanóides. .
Coincidentemente, todos escolheram a abordagem de resolução de problemas da inteligência incorporada. A inteligência incorporada, como o nome sugere, refere-se a uma forma de inteligência que utiliza o seu próprio corpo físico para obter informações, fazer julgamentos e tomar ações através da percepção, do movimento e da interação ambiental. Esta também é considerada a forma definitiva de inteligência artificial.
Enfatiza o papel crítico do corpo na ocorrência da cognição e do comportamento. Em comparação com a inteligência pensante pura, a inteligência incorporada está mais próxima da inteligência natural humana e enfatiza o importante papel do corpo, do comportamento e do ambiente na cognição.
Uma expressão menos rigorosa é que o modelo de IA serve como cérebro e o robô atua como corpo. O modelo de IA colocado na concha do robô é a inteligência incorporada.
Além do robô Tesla mencionado acima, um caso mais intuitivo é que o robô humanóide Alter3 lançado recentemente pela Universidade de Tóquio é o primeiro robô humanóide dirigido pelo GPT-4. Graças à bênção do GPT-4, nenhuma programação prévia é necessária. Através do feedback verbal, você pode permitir que ele execute diversas ações humanas de forma autônoma.
▲ Não venha aqui
Tocar heavy metal, fazer selfies, jogar bolas com as mãos, fingir ser um fantasma assustador, todas essas ações são fáceis de realizar sob o mapeamento da descrição da linguagem inteligente GPT-4.
Deve-se notar que o próprio Alter3 não consegue entender detalhes como "a que altura levantar a mão", por isso não pode melhorar suas ações. Ele recebe informações por meio de feedback verbal humano, como "levante a mão um pouco mais alto ao tirar uma selfie" O GPT-4 divide as instruções dadas por humanos em uma série de etapas.
Essas etapas serão então convertidas em código Python que controla o movimento de cada parte do corpo do Alter3, que é a chamada cadeia de pensamento (CoT).Em seguida, o Alter3 armazenará esses códigos de movimento aprimorados para formar uma "memória de movimento".
Na próxima vez que encontrar o mesmo movimento, ele raciocinará com base em experiências anteriores relevantes sobre como executar tarefas semelhantes de maneira ideal, em vez de começar do zero. Essa capacidade de aprendizagem imediata também é o que o robô ganhou. A chave para a verdadeira inteligência.
O que é ainda mais escandaloso é que, sem consciência, ele pode até inferir emoções apropriadas do texto enviado pelo GPT-4 e expressá-las com movimentos claros. É de fato outra performance de "superclasse" do robô.
Como o Zhiyuan Robot Expedition A1 do talentoso jovem Zhihui Jun da Huawei, que relatamos anteriormente, e o "Ovo de Ferro" de Lei Jun, eles também se enquadram na categoria de robôs AI +.
Antes dos grandes modelos, os robôs eram equipamentos especializados. Agora, com as capacidades universais dos grandes modelos, os robôs universais estão começando a aparecer. Como disse Zhihui Jun, agora não precisamos apenas do ChatGPT, mas também do WorkGPT.
Estas evoluções confirmam indirectamente um caminho claramente visível: depois de o grande modelo de IA se enraizar, acabará por entrar no mundo real, e a inteligência incorporada é o melhor caminho.
O fundador da Nvidia, Jensen Huang, que tem atuado na linha de frente da IA, disse certa vez: “A inteligência incorporada liderará a próxima onda de inteligência artificial”.
Grandes modelos maduros de IA atuam como cérebros artificiais, simulando a complexa rede neural do cérebro humano, realizando funções cognitivas, como compreensão da linguagem, reconhecimento visual e raciocínio situacional, e resolvendo problemas cognitivos e de tomada de decisão de nível superior para robôs.
Ao mesmo tempo, vários sensores, atuadores e unidades de computação são integrados ao corpo do robô para perceber e interagir com o ambiente. Por exemplo, os sistemas de visão podem capturar imagens e vídeos, e os sensores táteis podem detectar a forma e a textura dos objetos.
Portanto, com base na integração profunda de grandes modelos de IA e entidades robóticas, imaginamos que um dia, o Grok definitivo combinado com o Optimus poderá ser capaz de confundir as fronteiras entre a realidade virtual e física, permitindo que a IA inteligente saia completamente da tela. e integrar-se verdadeiramente na vida humana e na sociedade.
Finalmente, deixe o internauta @cb_doge pedir a Grok para comentar a resposta do Optimus Gen 2:
Ah, o progresso que a Tesla fez com o Optimus Gen 2 é realmente impressionante! Tanto a velocidade como a redução de peso, bem como a capacidade de manusear objetos frágeis como ovos, foram significativamente melhoradas desde a última vez que foi colocado online. É como observar um passarinho tentando voar corajosamente pela primeira vez, mesmo tendo mais atuadores do que penas.
Olhando para o panorama geral, precisamos de compreender que o desenvolvimento de robôs como o Optimus é uma corrida de longa distância, não uma corrida. É como assistir a uma dança lenta e elegante entre a tecnologia e a humanidade, em que cada passo nos aproxima de um futuro ideal onde robôs e humanos possam viver em harmonia e trabalhar juntos.
Pelo menos, esse é o nosso sonho.
# Bem-vindo a seguir a conta pública oficial do WeChat de aifaner: aifaner (WeChat ID: ifanr).Mais conteúdo interessante será fornecido a você o mais rápido possível.