Meta está construindo um ‘tradutor de linguagem universal’ da era espacial

Quando você pensa em ferramentas com inteligência artificial (IA) hoje em dia, é natural que o ChatGPT e o Bing Chat venham à mente. Mas o proprietário do Facebook, Meta, quer mudar isso com o SeamlessM4T, um “tradutor de linguagem universal” alimentado por IA que pode converter instantaneamente qualquer idioma do mundo em qualquer resultado que você desejar.

Meta descreve o SeamlessM4T como “o primeiro modelo completo de tradução e transcrição de IA multimodal multilíngue”. Isso é bastante complicado, mas em termos simples, significa que pode converter idiomas de várias maneiras diferentes, como pegar o áudio da fala e transformá-lo em texto em um idioma diferente.

A silhueta de uma pessoa segura um smartphone exibindo o logotipo do Facebook. Eles estão em frente a uma placa que mostra o logotipo da Meta.

Segundo Meta, os recursos de reconhecimento de fala e tradução da ferramenta podem funcionar de algumas maneiras diferentes:

• Reconhecimento de fala para quase 100 idiomas
• Tradução de voz para texto para quase 100 idiomas de entrada e saída
• Tradução de fala para quase 100 idiomas de entrada e 36 idiomas de saída (incluindo inglês)
• Tradução de texto para texto para quase 100 idiomas
• Tradução de texto para fala para quase 100 idiomas de entrada e 35 idiomas de saída (incluindo inglês)

Meta diz que isso “permitirá que as pessoas se comuniquem sem esforço por meio de fala e texto em diferentes idiomas”.

Em breve no Facebook?

A ferramenta de tradução AI da Meta, SeamlessM4T, converte entradas do idioma espanhol para vietnamita, tanto em formato de texto quanto de áudio.

SeamlessM4T está sendo lançado sob uma licença de pesquisa, e Meta afirma que está fazendo isso para “permitir que pesquisadores e desenvolvedores desenvolvam este trabalho”. Além disso, os metadados do conjunto de dados que foi utilizado para treinar o modelo de tradução, denominado SeamlessAlign, também estão sendo divulgados publicamente. Isso consiste em “270.000 horas de fala minada e alinhamentos de texto”, afirma Meta.

No entanto, Meta não deixou claro de onde foram originadas essas 270.000 horas de “fala minada”. Foram levantadas preocupações sobre as implicações de privacidade do trabalho da Meta em chatbots de IA , enquanto outras ferramentas de IA já foram flagradas roubando trabalho protegido . Não há dúvida de que haverá temores de que o Meta possa ter feito algo semelhante ao treinar o SeamlessM4T.

Já existem outras ferramentas de tradução, como o Google Translate, que podem converter texto em texto e fala em texto, mas Meta diz que seus próprios esforços são superiores. SeamlessM4T, argumenta Meta, “reduz erros e atrasos, aumentando a eficiência e a qualidade do processo de tradução”.

A Meta não disse se a nova ferramenta será integrada em seus aplicativos como Facebook e Instagram, mas a empresa revelou que pretende “explorar como este modelo fundamental pode permitir novas capacidades de comunicação” no futuro. Teremos que ver o que isso implica.