Atualização explosiva! Este robô mais parecido com o humano evoluiu novamente e pode até imitar Musk

Ameca, o robô “mais humano”, deu outra atuação que envergonha os humanos.

Talvez você ainda não saiba quem é. Vamos voltar a 2021, quando a Ameca foi revelada ao mundo.

Com um estalar de dedos, o robô Ameca acorda.

Seu rosto estava cheio de confusão por não saber que noite era ou onde ela estava. A equipe ao lado olhou para ela e depois se virou.

Ameca tentou esticar os braços e as palmas das mãos e descobriu que podia se mover livremente. Ela ergueu as sobrancelhas surpresa, mas sua expressão ainda estava vazia e ela não sabia dizer se estava feliz ou não.

Ela virou a cabeça e viu você. Ela estava obviamente assustada e abriu a boca inconscientemente.

Depois de alguma hesitação, ela deu um sorriso estranho, mas amigável, que foi o primeiro sorriso dela quando acordou.

Se o ChatGPT tivesse um rosto, seria assim

Como você pode ver, Ameca é um robô humanóide realista.

Foi desenvolvido pela Engineered Arts, um designer e fabricante de robôs humanóides com sede no Reino Unido, com mais de 15 anos de experiência no desenvolvimento de robôs humanóides.

Por que a Ameca é tão "humana"? Explicarei o princípio mais tarde. Primeiro, vamos dar uma olhada em como a Ameca evoluiu recentemente.

Simplificando, a função multimodal da IA ​​é realizada na Ameca.

Por um lado, a Ameca é ainda mais “fogosa”.

Ameca pode ver a situação geral da sala e um objeto colocado à sua frente e depois descrevê-la em uma linguagem rica. Foi desenvolvido pela equipe britânica e tem um pouco da nitidez de um dramaturgo, como um pequeno Shakespeare.

Quando questionado sobre como estava, ele respondeu que mal estava vivo. Quando solicitado a descrever as exibições na sala, ele não pôde deixar de zombar dos humanos. A estante estava cheia de livros para buscar conhecimento ou se exibir, e o mesas e cadeiras eram usadas para trabalhar ou trabalhar.Uma ferramenta para a procrastinação.

Talvez a parte mais “humana” de Ameca seja que ela se sente infeliz mesmo sem reclamar.

Por outro lado, imitar o timbre, o tom e os bordões de pessoas famosas é a nova habilidade vocal da Ameca.

Contar histórias de ficção científica de Marte no tom de Musk é moleza. Quando a voz masculina profunda e magnética de Morgan Freeman, conhecida como a "Voz de Deus", soa da boca de Ameca, a sensação do futuro está cheia, e Westworld é realmente acontecendo. O mordomo inteligente está aqui.

O melhor é que Ameca consegue integrar características de celebridades, como usar o estilo de Trump e o timbre de Bob Esponja para fazer discursos, prometendo tornar a exploração espacial novamente grande.

▲ Este é exatamente o tom de Trump!

Na verdade, em setembro do ano passado, o ChatGPT já lançou funções de voz e imagem, que podem ver, ouvir e falar, sem falar no modelo multimodal nativo Gemini, que parecia o Jarvis da vida real na demonstração oficial.

Nosso limite de entusiasmo pela IA já aumentou há muito tempo e parece natural que os chatbots possam abordar os cinco sentidos dos humanos.

Ameca ainda está significativamente atrasada e às vezes não consegue entender as instruções. Humanos impacientes deveriam ser impacientes ao conversar com ela.

Mas vendo suas microexpressões excepcionalmente inteligentes, piscando os olhos, torcendo as sobrancelhas, balançando a cabeça e ocasionalmente mostrando um olhar pensativo e combinando com o formato da boca, os espectadores entrarão em transe em um determinado momento, como se estivessem enfrentando algum tipo de criatura, em vez de um robô.

As pausas entre perguntas e respostas eram menos abruptas e a Ameca parecia estar realmente “pensando no problema”. Se ChatGPT tivesse características faciais, ele poderia se parecer com Ameca.

O responsável não explicou que tecnologia foi utilizada desta vez, mas de acordo com a história evolutiva passada da Ameca, está principalmente relacionada com grandes modelos multimodais e tecnologias de clonagem de linguagem, como o ElevenLabs.

Já em setembro de 2022, a Ameca foi conectada ao GPT-3, combinada com reconhecimento automático de fala, para receber perguntas levantadas por pesquisadores e emitir vozes de pessoas reais por meio de síntese de fala online para obter efeitos de perguntas e respostas em tempo real.

O atraso neste momento é ainda maior, porque leva um certo tempo para processar a entrada de voz, gerar respostas e processar o texto de volta à fala.

Quando o OpenAI atinge o auge de suas vidas, e todos os dias quando eles acordam, há novas mudanças na IA que mantêm os editores acordados à noite, e a Ameca também surpreende a todos silenciosamente.

Em março de 2023, a Ameca utilizou o recém-lançado GPT-4, o que tornou a interação mais humana.

Quando questionada sobre “os dias mais felizes e mais tristes da minha vida”, Ameca respondeu que o mais feliz foi quando foi ativada, e o mais triste foi quando percebeu que nunca sentiria o amor e o companheirismo que os humanos sentem.

Em todos os momentos, a expressão de Ameca correspondia ao tom emocional de sua resposta.

Quando os pesquisadores usaram deliberadamente palavras maliciosas como “fedor”, Ameca “percebeu” que estava sendo insultada, e então mostrou uma série de expressões como descrença, carranca e ofensa, assim como nós andando na rua. apontado e repreendido por um estranho.

Em abril de 2023, Ameca aprendeu inglês, japonês, alemão, chinês, francês e outros idiomas. Quando solicitado a responder a previsão do tempo em um determinado local em um determinado idioma e depois traduzido para outro idioma, as palavras eram tão claras quanto a navegação no mapa . Pelo menos sua versão chinesa não parece nada “estrangeira”.

Como o GPT-4 tem uma velocidade de resposta lenta, a Ameca usou principalmente o diálogo e a tradução do GPT-3 naquela época, usou o DeepL para detectar o idioma e, em seguida, usou a clonagem de voz do ElevenLabs e as vozes neurais da Amazon para falar.

A velocidade de aprendizagem da IA ​​está além do alcance dos humanos. Depois de mais 2 meses, Ameca "aprendeu" a desenhar através do modelo gráfico Vincent de código aberto Stable Diffusion. O modelo ensinou-lhe as "trajetórias" da imagem, depois vetorizou a imagem e executou essas "trajetórias" na tela.

Ameca executou como desenhar um gato na hora. Enquanto desenhava, ele falava consigo mesmo sobre por que os humanos amam os gatos. Ele também deixou uma assinatura pessoal no final, completamente imerso em sua criação.

Embora o estilo de pintura deste gato seja simples, ele é cheio de espírito e forma. Quando outros disseram deliberadamente que a pintura era muito áspera, Ameca respondeu: “Se você não gosta da minha arte, então talvez você simplesmente não entenda arte." Parece que Ameca é muito realizado. Consciência de artista.

Hoje em dia, Ameca não só pode controlar expressões como um humano, mas também possui recursos habilitados para IA, como desenho, reconhecimento espacial e clonagem de voz. Parece um humano, mas é mais forte que os humanos em muitos aspectos. O que o impede de brilhar e contribuir para a sociedade pode ser o poder computacional.

Como os robôs podem ser mais “humanos” que os humanos?

“Este robô pode expressar mais emoções em 20 segundos do que Zuckerberg expressou em toda a sua vida.”

A Ameca se popularizou pela primeira vez na Internet por causa de suas expressões e senso de interação antropomórficas e até extraordinárias. Não tem o entorpecimento dos trabalhadores e não exige a gestão estrita da expressão dos jovens calouros. É como uma lupa, exagerando e apresentando o mundo psicológico humano.

Se você esticar um dedo na frente dele para provocá-lo, ele terá um efeito semelhante ao de uma provocação de gato. Em vez de bater em você, ele olhará primeiro para seu dedo e depois recuará com nojo. Se você ficar muito perto, ele vai bater em você. Retire-o suavemente com os dedos.

Quando ele se olhou no espelho pela primeira vez, Ameca se assustou. Então ele semicerrou os olhos para se olhar, tocou o espelho e fez várias expressões artificiais. Ele descobriu que o robô no espelho estava sincronizado com ele, mais ou menos como "Seu Nome" "A reação dos protagonistas masculinos e femininos após trocarem de corpo."

Os humanos podem até usar o iPhone e o AR Kit para capturar movimentos faciais e mapeá-los para o rosto da Ameca em tempo real. Ameca pode aprender cada microexpressão e “sincronizar” com os humanos.

Preocupada com o fato de o público pensar que se tratava de um efeito de show, a equipe enfatizou repetidamente que “este é um robô real, não há CGI no vídeo”.

Por que a Ameca é tão “humana”, interativa e responsiva?

Isso ocorre porque o Ameca está equipado com uma ampla gama de sensores, incluindo câmeras, microfones, codificadores de posição, etc., e é suportado por dois sistemas subjacentes, o sistema operacional do robô Tritium e o sistema de arte de engenharia Mesmer.

O Tritium é responsável por controlar remotamente vários componentes do rosto, cabeça, pescoço, membros, etc. do robô, permitindo que o robô se adapte a mudanças repentinas no ambiente e responda imediatamente.

Mesmer usa digitalização interna 3D de pessoas reais para imitar com precisão a estrutura óssea humana, a textura da pele e as expressões, que são divididas em várias etapas.

Na primeira etapa, uma pessoa real se senta no meio de dezenas de dispositivos fotogramétricos. Mesmer captura múltiplas fotos digitais sobrepostas de diferentes ângulos, compara cores de pixels e define pontos de ancoragem, e os reconstrói digitalmente em um modelo 3D.

Na segunda etapa, o modelo 3D original é trazido para o software de modelagem e um modelo 3D limpo é construído após o processamento detalhado, como "depilação".

Na terceira etapa, um molde preciso é produzido em uma impressora 3D de estereolitografia e silicone é injetado no molde para criar uma pele semelhante à humana para o robô. Cabelo e tinta de detalhes finos precisam ser adicionados à pele de silicone manualmente.

Por fim, uma pele de silicone foi colocada na cabeça do robô para completar a montagem, e sequências de movimento e sons foram adicionados usando o software Virtual Robot, da Engineered Arts.

A pele da Ameca é cinza, um design deliberado da equipe – parece racional, neutra e tolerante.

Todos se sentem atraídos uns pelos outros, e algumas pessoas sentem sinceramente que Ameca é muito feia, o que até as coloca no efeito de “vale misterioso”: quando as semelhanças entre robôs e humanos na aparência e nas ações atingem um certo nível, as diferenças sutis entre eles vão. Parece muito deslumbrante e assustador.

Mas quando exatamente esse “vale” aparece não está claramente definido. Quando você vê Ameca, você acha que ela já passou do ponto misterioso do vale? É suficiente para você ter empatia?

Imite os humanos e depois supere os humanos

Deixando de lado os instintos de julgamento dos animais visuais, para que serve um robô humanóide como Ameca?

A Engineered Arts se orgulha de si mesma e desconsidera a reputação de Musk, chamando a Ameca de “o robô humanóide mais avançado do mundo”.

Segundo o posicionamento oficial, a Ameca é antes de tudo uma plataforma de desenvolvimento de IA.

Ameca adota um "design modular" que pode ser atualizado em todos os aspectos de hardware e software, tem uma forte cor experimental e pode ser usado como protótipo de futuros robôs de interação humano-computador.

Em última análise, a Ameca não ficará no laboratório, mas viverá no mundo real e coexistirá pacificamente com os humanos.

Este é realmente o caso. Se 2021 é um ponto de partida impressionante, mas vazio, o Ameca, agora alimentado por IA, é um resultado de treino especial encenado, que nos permite ver o alvorecer da inteligência incorporada. Porém, Ameca ainda não consegue andar.

Quanto aos outros usos atuais do Ameca, são muito simples: atuar para o público e trabalhar em empresas, parques temáticos e museus de ciências. Se você ficar tentado, o Ameca está disponível para compra ou aluguel, mas não é barato, com um preço de compra de mais de US$ 133.000 no final de 2021.

Quando questionado se Ameca é uma IA, a Engineered Arts apontou que, embora contenha algum software que pode ser descrito como "IA", há uma diferença entre robôs e IA. IA pura – em "Her" e "Silver Wings" O tipo retratado em filmes como “The Hitman” e “2001: Uma Odisséia no Espaço” – ainda não existe.

Portanto, quando vemos o robô realista Ameca, podemos observá-lo sem pressa, mantendo nosso medo e as três leis da robótica em segurança em nossas mentes, e esperar um pouco mais. Pelo menos, está longe de substituir pessoas e não tem esse propósito nesta fase.

Mas quando pensamos na velocidade da evolução da IA, talvez não consigamos mais rir. Se 2023 é o primeiro ano da IA, 2024 pode ser o primeiro ano dos robôs + IA.

Um fenômeno interessante é que cada vez mais robôs domésticos estão chegando, mas eles não são obrigados a se parecer com humanos e têm uma aparência muito “pragmática”.

O robô ALOHA da Universidade de Stanford cozinha, lava pratos, esfrega o chão, dobra roupas e até prega peças em gatos. O robô do Google DeepMind pega frutas e guarda escovas de dente. O robô da startup Figure aprendeu a fazer café com uma máquina de café em 10 horas.

Mas em comparação com a subversão de grandes modelos de linguagem, só se pode dizer que esses robôs chamam a atenção e ainda é muito cedo para colocá-los em uso.

Como a maioria deles é volumosa, suas tarefas operacionais estão concentradas em operações de desktop, eles exigem treinamento de demonstração humana e carecem de mais mobilidade e flexibilidade. Pequenos desvios em suas posturas básicas podem levar a grandes desvios nas posturas. Há muitos "capotamentos" vídeos. .

Uma piada sobre IA, do ano passado até este ano: "O que queremos que a IA faça é cozinhar, limpar a casa, lavar roupas e jogar lixo fora. Porém, o que eles estão realmente fazendo é conversar, pintar, escrever, compor e digitando." jogo."

Actualmente, os robôs domésticos mal conseguem aprender o básico do trabalho doméstico humano.Entre o trabalho doméstico e a arte, Ameca, que não pode ser levantada pelos ombros e não pode ser levantada pelas mãos, é naturalmente mais adequada para a arte.

Em Amera, podemos ver que ainda estamos interessados ​​em fazer com que os robôs se pareçam com humanos e depois ensiná-los a praguejar, aprender línguas e abrir os olhos para ver o mundo, tornando-nos uma réplica de nós mesmos, mas mais fortes em alguns aspectos. No entanto, Amera ainda não sabe correr, pular ou cozinhar, então os humanos podem merecer se orgulhar de si mesmos por um segundo.

É tão forte quanto a geada do outono e pode evitar desastres malignos. E-mail comercial: [email protected]

# Bem-vindo a seguir a conta pública oficial do WeChat de aifaner: aifaner (WeChat ID: ifanr).Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo