Voz comum: Mozilla Italia dá início ao novo concurso
Depois de um primeiro concurso experimental Common Voice, a Mozilla Italia retorna com um novo concurso dentro do projeto para a coleção de gravações vocais . O objetivo é divulgar a iniciativa da Mozilla também para a língua italiana, enriquecendo uma base de dados aberta, colaborativa e pública. Muitas áreas seriam beneficiadas, inclusive a de acessibilidade, ainda pouco pensada e desenvolvida.
Voz comum: o projeto Mozilla
Common Voice é parte da iniciativa da Mozilla para melhorar a indústria de reconhecimento de voz digital. O projeto fornece um banco de dados público de gravações de voz, que pode ser baixado e usado em vários sistemas de aprendizado de máquina que trabalham na área de reconhecimento de voz . A capacidade de alavancar tecnologias que entendem a linguagem natural oferece vários benefícios, acelerando e automatizando muitos processos.
A iniciativa nasceu em 2017 e é um projeto de crowdsourcing para a construção de uma base de dados pública e gratuita de inscrições . Para desenvolver um software de reconhecimento de fala, de fato, é necessário ter acesso a uma grande e heterogênea quantidade de dados de fala para serem usados como treinamento para os algoritmos de aprendizagem. Um dos principais problemas em encontrar as gravações, no entanto, é a ausência de um banco de dados bem fornecido: a maioria dos conjuntos disponíveis, na verdade, são proprietários e, portanto, pagos; daí a ideia de código aberto da Mozilla.
O projeto requer "fornecer sua voz" para construir um banco de dados de voz para que os desenvolvedores possam criar sistemas cada vez mais precisos. Existem duas maneiras de contribuir (gratuitamente) para o projeto: falando e ouvindo . No primeiro caso, um pequeno texto fornecido pela Mozilla é gravado e a gravação é enviada para uma fila de escuta: a peça será então ouvida por outros usuários e a precisão da leitura será avaliada. Se pelo menos dois usuários validarem o clipe, ele será adicionado ao conjunto de dados compartilhado. Se, por outro lado, o registro for rejeitado por dois colaboradores, ele é inserido no denominado "cemitério de registros", que ainda é de acesso público. No segundo caso, a contribuição se dá por meio da escuta, tornando-se validadores das frases lidas e promovendo ou rejeitando os clipes de áudio.
O concurso Mozilla Itália
Se as bases de dados de línguas como o inglês, o francês e o alemão são muito bem fornecidas, o mesmo não se pode dizer do italiano. O Common Voice Corpus 6.1, a versão mais recente do conjunto de dados, tem de fato 56 GB de dados para o idioma inglês, contra apenas 5 GB para o nosso idioma. Entre as características que determinam a qualidade de um conjunto de dados, além da quantidade de dados, está a diversidade dos registros. Além de gênero e idade, também é importante treinar nos diferentes sotaques dos usuários, especialmente em um país como a Itália, onde as inflexões dialetais são muito marcadas e heterogêneas.
Por esta razão, a Mozilla Italia lançou um concurso com o objetivo de promover o projeto Common Voice e enriquecer a base de dados italiana . O concurso começou há uma semana e já arrecadou 20 horas de gravações, com 35 colaboradores inscritos. Participar é muito simples: depois de baixar o aplicativo Doe sua voz: Projeto de CV (apenas na PlayStore para Android 6+) e criar uma conta, você precisa ir em Configurações -> Avançado e clicar em Mostre-me a linha que me identifica no aplicativo e , em seguida, faça uma captura de tela de sua ID de usuário e envie-a aos organizadores. Este procedimento deve ser repetido no final da competição. Para toda a duração do evento, cada validação ganha 1 ponto, enquanto cada inscrição 2 pontos. Os primeiros 20 finalistas que marcarem mais pontos receberão gadgets e camisetas.
Ter acesso gratuito a um grande conjunto de dados multilíngue é essencial para aprimorar a tecnologia de reconhecimento de voz. No entanto, as ferramentas de apoio à inovação devem ser de qualidade facilmente acessível a todos, para que todos possam dar o seu contributo e acelerar novos desenvolvimentos. Enriquecer o conjunto de dados significa facilitar o trabalho de pesquisadores, alunos e qualquer pessoa que queira contribuir para o aprimoramento das tecnologias de reconhecimento de fala .
O artigo Common Voice: Mozilla Italia dá início ao novo concurso vem de Tech CuE | Engenharia de Close-up .