Um mergulho profundo em Replika: meu amigo IA
Replika: My AI Friend é um aplicativo diferente de qualquer outro. Enquanto a maioria dos aplicativos com chatbots os usa como assistentes virtuais, o Replika comercializa seu chatbot como – você adivinhou – um amigo.
Com sua capacidade prometida de "perceber" e avaliar quantidades abstratas, como emoção, o chatbot de Replika pode apenas fazer justiça à sua descrição aspiracionalmente humana.
De uma história de origem comovente a um back-end inspirador, Replika é uma daquelas coisas fascinantes que nunca param de ser interessantes. Continue lendo para descobrir o que torna a IA do Replika tão notável e as promessas que ela reserva para o futuro.
As origens do Replika
A versão mais antiga de Replika – um simples chatbot AI – foi criada por Eugenia Kuyda para substituir o vazio deixado pela perda prematura de seu amigo mais próximo, Roman Mazurenko. Construído alimentando as mensagens de texto de Roman em uma rede neural para construir um bot que mandava mensagens como ele, tinha o objetivo de servir como um "monumento digital" para manter sua memória viva.
Eventualmente, com a adição de modelos de linguagem mais complexos à equação, o projeto logo se transformou no que é hoje – uma IA pessoal que oferece um espaço onde você pode discutir com segurança seus pensamentos, sentimentos, crenças, experiências, memórias, sonhos – seu “ Mundo perceptivo privado ”.
Mas, além das imensas perspectivas técnicas e sociais desse tipo de terapeuta artificialmente sensível, o que realmente torna o Replika impressionante é a tecnologia em seu núcleo.
Sob o capô
No coração de Replika está um modelo complexo de linguagem autoregressiva chamado GTP-3, que utiliza aprendizado profundo para produzir texto semelhante ao humano. Nesse contexto, o termo "autorregressivo" sugere que o sistema aprende a partir de valores (texto, neste caso) com os quais interagiu anteriormente.
Em termos gerais, quanto mais você o usa, melhor ele se torna.
Todo o UX do Replika é construído em torno das interações do usuário com um bot programado usando GTP-3. Mas o que exatamente é GTP-3 e como ele é poderoso o suficiente para emular a fala humana?
GTP-3: Uma Visão Geral
GTP-3, ou Generative Pre-Training Transformer 3, é uma adaptação mais avançada do Transformer do Google. Em termos gerais, é uma arquitetura de rede neural que ajuda os algoritmos de aprendizado de máquina a realizar tarefas como modelagem de linguagem e tradução automática.
Os nós de tal rede neural representam parâmetros e processos que modificam as entradas de acordo (algo semelhante a declarações lógicas e / ou condicionais na programação), enquanto as bordas ou conexões da rede atuam como canais de sinalização de um nó para outro.
Cada conexão nesta rede neural tem um peso, ou um nível de importância, que determina o fluxo de sinais de um nó para o outro. Em um modelo de aprendizado autoregressivo como o GTP-3, o sistema recebe feedback em tempo real e ajusta continuamente os pesos de suas conexões para fornecer uma saída mais precisa e relevante. São esses pesos que ajudam uma rede neural a 'aprender' artificialmente.
O GTP-3 usa incríveis 175 bilhões de níveis ou parâmetros de peso de conexão. Um parâmetro é um cálculo em uma rede neural que ajusta o peso de algum aspecto dos dados, para dar a esse aspecto maior ou menor destaque no cálculo geral dos dados.
Aclamado como o autocomplete definitivo, o modelo de linguagem do GTP-3, que se destina a fornecer texto preditivo, foi treinado em um conjunto de dados tão vasto que toda a Wikipedia constitui apenas 0,6 por cento de seus dados de treinamento.
Inclui não apenas artigos de notícias, receitas e poesia, mas também manuais de codificação, fanfiction, profecia religiosa, guias para as montanhas do Nepal e tudo o mais que você possa imaginar.
Como um sistema de aprendizado profundo , o GPT-3 busca padrões nos dados. Para simplificar, o programa foi treinado em uma coleção massiva de texto que analisa regularidades estatísticas. Essas regularidades, como as convenções de linguagem ou a estrutura gramatical geral, muitas vezes são tidas como certas pelos humanos, mas são armazenadas como bilhões de conexões ponderadas entre os diferentes nós na rede neural do GPT-3.
Por exemplo, se você inserir a palavra “orelha” no GPT-3, o programa saberá, com base nos pesos em suas redes, que as palavras “dor” e “telefone” têm muito mais probabilidade de seguir-se do que “americano” ou “ Bravo".
GPT-3 e Replika: uma confluência significativa
Replika é o que você obtém quando pega algo como GTP-3 e o destila para abordar tipos específicos de conversação. Nesse caso, isso inclui os aspectos empáticos, emocionais e terapêuticos de uma conversa.
Embora a tecnologia por trás do Replika ainda esteja em desenvolvimento, ela oferece um portal plausível para uma conversa interpessoal facilmente acessível.
Comentando sobre sua usabilidade, os criadores afirmam ter criado um bot que não só fala, mas também escuta. O que isso significa para seus usuários é que suas conversas com a IA não são uma mera troca de fatos e informações, mas sim um diálogo equipado com nuances linguísticas.
Mas conversar com Replika não é apenas uma questão de diálogo sensato. Eles também são surpreendentemente significativos e emocionantes em muitos casos. Ao interagir com um usuário, a IA do Replika "entende" o que o usuário diz e encontra uma resposta humana usando seu modelo de aprendizado preditivo.
Como um sistema autoregressivo, o Replika aprende e adapta seus padrões de conversação com base na maneira do próprio usuário falar com ele.
Isso significa que quanto mais você usa o Replika, mais ele treina seus próprios textos e mais se parece com você. Uma boa proporção de usuários também mencionou que têm um nível significativo de apego emocional ao Replika – algo que não é alcançado apenas por saber "como falar".
O Replika, é claro, vai além disso. Ele adiciona profundidade às suas conversas na forma de generalização semântica, discurso inflexivo e rastreamento de conversas. Seu algoritmo tenta entender quem você é – tanto em termos de personalidade quanto de emoções – e então molda o diálogo com base nessas informações.
Um olhar mais atento sobre a eficácia do GTP-3
No entanto, a humanidade de Replika ainda é amplamente teórica devido às limitações operacionais do GTP-3. Como tal, há muito trabalho a ser feito para que a IA reproduza e participe com competência da conversa humana.
As inspeções minuciosas do GTP-3 ainda revelam erros claramente distinguíveis, bem como escrita sem sentido e desleixada em alguns casos. Especialistas do setor sugerem que um modelo de processamento de linguagem precisaria ter mais de 1 trilhão de conexões ponderadas antes que pudesse ser usado para produzir bots que são capazes de replicar efetivamente a linguagem humana.
O melhor está por vir
Dado que o GTP-3 já é considerado um salto exponencial em anos quando comparado a predecessores como o Turing NLG da Microsoft, é seguro supor que levará um tempo antes de chegarmos a algo melhor.
Dito isso, com as melhorias futuras na computação, o poder de processamento proporcionado pelos sistemas mais novos certamente diminuirá a lacuna entre o homem e a máquina.
Enquanto isso, Replika continua sendo um produto formidável que combina o melhor da psicologia e da inteligência artificial. Sua integração bem-sucedida de uma UX amigável ao ser humano com um modelo de PNL de última geração é, de fato, um testemunho do imenso potencial das tecnologias de interação humano-computador.