Modelos Bayesianos para a Compreensão da Linguagem Humana.

Tentar tirar conclusões e teorias sobre o mundo é um aspecto fundamental da inteligência humana. Essa faculdade se manifesta principalmente no desenvolvimento histórico da ciência, mas também na cognição cotidiana e no desenvolvimento infantil. Um objetivo fundamental tanto para a inteligência artificial quanto para a ciência cognitiva comportamental é, portanto, desenvolver métodos para entender o processo de inferência.
Pesquisadores do MIT e da Universidade de Cornell, juntamente com os da McGill, nesse sentido, eles estudaram o problema da descoberta teórica orientada por IA. Graças ao desenvolvimento dos Modelos Bayesianos, eles usaram a linguagem humana como campo de testes .

A escolha da linguagem para treinar os Modelos Bayesianos

As linguagens humanas são notoriamente complexas , e os linguistas há muito pensam que uma máquina não poderia analisar os sons da fala e as estruturas das palavras. Não como os pesquisadores humanos podem, pelo menos.

Mas então por que alimentar e testar o modelo de Inteligência Artificial com fonemas e gramática?
Um professor assistente de ciência da computação na Universidade de Cornell, principal autor do estudo , respondeu:

Uma das motivações para este trabalho foi o desejo de estudar sistemas que aprendam modelos de conjuntos de dados representados de forma compreensível para humanos. Em vez de pesos, o modelo pode aprender expressões ou regras? E queríamos ver se poderíamos construir este sistema para aprender sobre toda uma bateria de conjuntos de dados interconectados, para que ele aprendesse um pouco sobre como melhor modelar cada um deles.

Kevin Ellis

Na prática, por meio desse protótipo de IA, os pesquisadores podem estudar hipóteses linguísticas . E também investigue as sutis semelhanças na forma como as diferentes línguas transformam as palavras. Sua peculiaridade reside no fato de que os humanos podem entender facilmente os padrões descobertos graças a ela. Isso ocorre porque o sistema adquire tais modelos (esquemas, regras) a partir de pequenas quantidades de dados, como algumas dezenas de palavras.

Em vez de usar um grande conjunto de dados para uma única tarefa, a IA usa muitos pequenos conjuntos de dados . O que está mais próximo da maneira como os cientistas propõem hipóteses: eles examinam vários conjuntos de dados relacionados e propõem modelos para explicar fenômenos.

O material utilizado e as características do uso de modelos bayesianos

Os cientistas, para o desenvolvimento de um sistema capaz de aprender um padrão a partir de múltiplos conjuntos de dados, optaram pela interação entre fonologia e morfologia. Em particular, eles testaram e treinaram o modelo por meio de problemas retirados de livros didáticos de linguística com 58 idiomas diferentes.

Cada problema apresentava uma série de palavras e as alterações correspondentes na forma das palavras . O modelo forneceu um conjunto de regras corretas para descrever as mudanças na forma das palavras em 60% dos problemas.

Ou seja, dadas palavras e exemplos de como essas palavras mudam para expressar diferentes funções gramaticais (como tempo, chance ou gênero) em um idioma, esse modelo de aprendizado de máquina elabora regras que explicam por que as formas dessas palavras mudam . Por exemplo, ele pode aprender que a letra “a” deve ser adicionada ao final de uma palavra para tornar feminina a forma masculina servo-croata.

Modelos Bayesianos

Para construir a IA que pode aprender um conjunto de regras para a montagem de palavras (gramática), os pesquisadores usaram uma técnica de aprendizado de máquina que faz uso de modelos bayesianos . Com esta técnica, o modelo resolve um problema escrevendo um programa de computador.

Divide et Impera

Nesse caso, o programa é a gramática que o modelo acredita ser a explicação mais provável das palavras e significados em um problema de linguagem. O modelo foi construído usando o Sketch, um programa de sintetizador popular também desenvolvido no MIT.

Mas o Sketch pode levar muito tempo para pensar no programa mais provável. Para contornar esse problema, como com conjuntos de dados, os pesquisadores executaram o modelo uma peça de cada vez , escrevendo um pequeno programa para explicar alguns dados, depois escrevendo um programa maior que modifica o pequeno programa para cobrir outros dados e etc.

O que o futuro reserva

O modelo muitas vezes encontrou soluções inesperadas. Em um caso, ele descobriu a resposta para um problema em polonês, mas também outra resposta correta que explorou um erro de livro didático. Isso mostra que o modelo é capaz de depurar a análise linguística, em certo sentido .

Modelos Bayesianos

Os pesquisadores também realizaram testes mostrando que o modelo foi capaz de aprender algumas regras fonológicas que poderiam ser aplicadas a todos os problemas. Aprendendo de uma língua para outra e sugerindo duas coisas. Há uma necessidade de melhores métodos para aprender entre os problemas e se você não conseguir encontrar esses métodos, este trabalho pode ajudá-lo a sondar diferentes ideias de qual conhecimento compartilhar para resolvê-los.

Apesar do progresso excepcional, os estudiosos ainda não entenderam qual é o viés indutivo que permite a um linguista aceitar gramáticas plausíveis e rejeitar gramáticas ridículas.

O artigo Modelos Bayesianos para a compreensão da linguagem humana foi escrito em: Tech CuE | Engenharia de close-up .