Este gadget de IA me permite falar em idiomas que não conheço ou não entendo
O Guia do Mochileiro das Galáxias declara que o peixe “Babel” é “provavelmente a coisa mais estranha do Universo”. É descrito como um peixe “semelhante a uma sanguessuga” que cabe no seu ouvido, se alimenta das ondas cerebrais do ambiente e depois defeca dentro do seu ouvido para produzir sons em um idioma que você entende. Efetivamente, é um dispositivo muito grosseiro e flagrante, mas extremamente sofisticado, para tradução em tempo real.
Quase meio século depois de Douglas Adams ter escrito a saga convulsiva e alucinante e devastadora (literalmente), o conceito de um peixe Babel ainda parece altamente fascinante. Embora ainda não estejamos tão perto do nível das traduções imediatas, das ondas cerebrais à defecação, um monte de gadgets estão perseguindo esse problema de uma forma muito menos repugnante. O modo Intérprete do Google e o Galaxy AI da Samsung são excelentes exemplos de tecnologias de tradução que estão prontamente disponíveis, mas algumas marcas querem resolver o problema separadamente do smartphone. Timekettle é uma dessas marcas, e seu mais recente hub X1 Interpreter é um dispositivo portátil que afirma fazer isso de maneira diferente (leia-se: melhor) usando IA.
Sou trilíngue e me diverti testando extensivamente o X1 AI Interpreter Hub da Timekettle. Mas, além de apenas me divertir, também usei-o para me comunicar em chinês com o fundador da empresa, baseado em Hong Kong, e durante uma viagem à Malásia no mês passado. Eu até me ofereci para acompanhar minha esposa assistindo seus dramas coreanos favoritos sem precisar de legendas, e detalharei abaixo como foi.
O que torna o Timekettle X1 tão diferente
Não faltam dispositivos dedicados especificamente destinados à tradução. O próprio Timekettle oferece uma série de acessórios (vários dos quais são portáteis) para resolver a lacuna de comunicação entre duas línguas muito distantes. Você provavelmente já ouviu falar de IA e tradução na mesma frase depois que o ChatGPT realmente entrou em cena no final de 2022.
Mas o X1 AI Hub, diz a empresa, adota uma abordagem melhor do que muitas das opções existentes. É uma solução independente que atualmente suporta até 40 idiomas e 93 sotaques, e espera-se que mais sejam adicionados em futuras atualizações de software. Ele ainda funciona offline (para idiomas selecionados) e oferece suporte a traduções por meio de um alto-falante ou um par de fones de ouvido (que vêm com ele).
Cada hub X1 possui um número de telefone exclusivo que pode ser usado para chamadas diretas, gratuitas e sem quaisquer restrições geográficas, desde que você tenha conectividade com a Internet. Mais importante ainda, qualquer tradução, seja em tempo real ou por telefone, é criptografada de ponta a ponta, o que evita que seja interceptada e interpretada por qualquer pessoa ao longo do caminho. Todos esses recursos estão reunidos em um gadget um tanto robusto, mas ainda de bolso, que roda em Android, o que simplifica as atualizações de software para a empresa e os usuários. Ele também suporta interação via tela sensível ao toque.
Hardware único e incomum
Falando em seus atributos físicos, o Timekettle X1 é um bloco retangular com quase o mesmo comprimento, mas com metade da largura de um telefone normal. Essas dimensões tornam bastante fácil de segurar e usar com uma mão.
A primeira coisa a notar é a tela sensível ao toque de 3,4 polegadas, que serve como principal — mas não o único — meio de interação com o tradutor. Há um botão multifuncional, capacitivo e não tátil ao lado da tela que geralmente aciona um gesto de “voltar”, mas também pode ser tocado e mantido pressionado para acionar o modo de tradução instantânea que discutirei mais tarde. Dois conjuntos de botões táteis estão na lateral para funções padrão, como ligar e desligar e aumentar e diminuir o volume. Um pequeno microfone fica próximo a eles.
A parte inferior do hub X1 possui uma porta USB-C para carregamento e uma faixa de alto-falante. A área também possui alguns blocos de conexão para pinos pogo, o que é útil ao usar um dock dedicado (vendido separadamente) que pode carregar até cinco hubs X1 simultaneamente. Esta parte do hub X1 também serve como uma bandeja que utiliza um mecanismo de pressão para abrir ou fechar. A bandeja é usada para estacionar os fones de ouvido, que fazem parte do gadget e são usados para transmitir vozes traduzidas diretamente aos seus ouvidos.
Na borda exatamente oposta estão mais dois recortes – presumivelmente para mais alto-falantes – e um ponto de contato NFC que pode ser usado para emparelhar dois hubs X1 instantaneamente.
A parte dos fones de ouvido do pacote vem em um design intra-auricular parcial e, portanto, não oferece nenhum isolamento de ruído. Embora possa distrair um pouco, esta é uma escolha consciente para garantir que as vozes reais de outras pessoas não sejam silenciadas. O design meio intra-auricular torna os fones de ouvido mais fáceis de cair, e o gesto do Timekettle de incluir ganchos e almofadas de silicone para mantê-los firmes parece atencioso. No entanto, o fato de os fones de ouvido precisarem ser colocados de volta dentro do dispositivo quando não estiverem em uso faz com que você perca os ganchos muito mais cedo e, na verdade, acabei não os usando.
Eu ainda gostaria que houvesse uma maneira de emparelhar fones de ouvido personalizados com o hub, mas a empresa me disse que ajustou especificamente os algoritmos de supressão de ruído com base nos drivers desses fones de ouvido. Portanto, a escolha de não oferecer suporte a soluções de escuta de terceiros também é consciente, pois interferiria na recepção.
A interface é realmente fácil de entender e interagir. Embora ainda seja baseado no obsoleto Android 10, a empresa me disse que continuará promovendo atualizações regulares na interface ao longo dos anos, principalmente para melhorar o vocabulário do algoritmo e a compreensão de gírias e sotaques. Embora fosse bom ver algumas mudanças visuais na interface, a empresa não faz reivindicações a esse respeito.
Como funcionam os recursos de tradução
O Timekettle Interpreter pode ser implantado de algumas maneiras diferentes para tornar as conversas multilíngues fáceis e sem esforço. Embora todos os modos tenham predominantemente o mesmo propósito – traduzir palavras faladas para o seu idioma preferido – cada um é otimizado para diferentes cenários. Com base no modo, você pode usar um ou vários hubs Timekettle X1 para interagir com outras pessoas.
Um a Um
O primeiro modo foi projetado para conversas íntimas entre apenas duas pessoas. Você coloca um dos fones de ouvido dentro do ouvido e compartilha o outro com a outra pessoa. Você pode atribuir idiomas diferentes a cada fone de ouvido e basicamente manter o hub de lado (mas dentro do alcance para que os fones de ouvido permaneçam conectados).
Os fones de ouvido escutam e retransmitem a mensagem de volta ao hub, que leva cerca de um segundo para ser traduzida. As palavras traduzidas são transmitidas de volta para o outro fone de ouvido instantaneamente. Tudo isso acontece enquanto toda a conversa é transcrita e exibida no display do hub X1.
As traduções neste modo são geralmente precisas, mas não verdadeiramente convincentes. O modo exige que você tenha uma distância suficiente entre os dois participantes para evitar que as vozes um do outro cortem os fones de ouvido um do outro. Se eles estiverem sentados próximos, o hub tende a não registrar as palavras corretamente – ou às vezes as entende corretamente, mas depois as substitui por algo menos significativo.
Ouça e reproduza
O próximo modo serve apenas para ouvir outra pessoa falar sem ter que falar você mesmo. Neste modo, você escolhe os idiomas, coloca o hub mais próximo da fonte de áudio e, em seguida, coloca os dois fones de ouvido dentro dos ouvidos.
A aplicação é simples e os resultados são tão bons quanto o esperado. Como os microfones dos fones de ouvido não estão acoplados e, portanto, não brigam entre si, a fala ocorre com mais fluidez.
É importante notar que embora as traduções comecem instantaneamente – e possam ser visualizadas no display – o hub X1 requer um intervalo de um a dois segundos para começar a tocar nos fones de ouvido. Isso pode dificultar um pouco a compreensão do contexto, especialmente quando o locutor não sabe que você precisa que ele recue um pouco para que o seu dispositivo de tradução entre em ação. Mas o discurso traduzido chega aos seus ouvidos com alguns segundos de atraso, o que, novamente, o deixa um pouco nervoso.
Para ser justo, isso é mais rápido e preciso do que a maioria dos smartphones oferece. Como escrevi, funciona bem quando o palestrante faz uma pequena pausa. Portanto, o modo é eficaz para quaisquer palestras ou apresentações online das quais você possa participar. Não é muito prático assistir a um filme ou programa de TV em outro idioma porque a fala traduzida soa muito mecânica, sem quaisquer emoções ou distinções linguísticas para diferentes personagens. A empresa diz que esses recursos chegarão em uma atualização futura, mas vou reservar minhas ideias até que eu mesmo os use.
Pergunte e vá
Ao contrário dos dois modos anteriores, que facilitam a tradução em ambientes mais silenciosos, o Ask & Go é mais adequado para ambientes mais barulhentos e ao ar livre. Mais importante ainda, ele realmente utiliza o design portátil, permitindo um uso rápido e direto.
Você pode definir o idioma uma vez e iniciar o modo para interagir sem quaisquer requisitos confusos para compartilhar fones de ouvido. O hub Timekettle X1 usará o microfone externo para ouvir os dois idiomas e depois reproduzirá a versão traduzida nos alto-falantes. Uma vez definido o idioma, você pode até alternar esse modo simplesmente segurando o botão capacitivo na frente, tornando-o o modo mais rápido e fácil de usar no tradutor.
Mais importante ainda, o modo permite que mais do que apenas dois usuários participem de uma conversa e detecta automaticamente quando um dos dois idiomas selecionados está sendo falado. Isso é especialmente útil quando você está viajando para um país estrangeiro e precisa interagir com alguém local em um ambiente social, como uma rua.
Embora a funcionalidade seja semelhante à que você pode obter com um telefone, a velocidade – e a precisão surpreendentemente melhorada em comparação com os modos que exigem fones de ouvido – tornam esse recurso muito atraente.
Chamada de voz
Outro recurso notável – e talvez de destaque – do hub Timekettle X1 Interpreter é sua capacidade de fazer chamadas de voz multilíngues, como chamadas normais pela Internet. Cada unidade recebe um número de telefone de seis dígitos que pode ser usado para ligar para outra unidade em qualquer lugar da Terra, desde que estejam conectados à Internet. O recurso está atualmente disponível gratuitamente e oferece tradução quase instantânea.
Para testar essa funcionalidade, conversei com Leal Tian, CEO e cofundador da Timekettle, usando o recurso de chamada de voz junto com uma chamada Zoom silenciada. Durante esta ligação, Tian falou em chinês enquanto eu falava em inglês. Nossa conversa abrangendo tópicos como a utilidade deste gadget, o uso do aprendizado de máquina e o futuro da empresa aconteceu completamente em dois idiomas distintos. O fluxo da tradução foi bastante tranquilo, mas houve alguns casos de repetição, especialmente quando o dispositivo tentava novamente traduzir algo no meio de uma frase. Isso gerou algum atrito, mas 90% do nosso bate-papo foi fácil.
Como você espera, isso pode mudar o jogo para as empresas, especialmente se você trabalhar com uma equipe de pessoas em diferentes regiões.
O que a ‘IA’ faz?
O hub Timekettle X1 AI Interpreter parece uma solução prática para preencher lacunas de comunicação, especialmente para ambientes empresariais. Um aspecto fundamental, devidamente representado pelo seu nome, é a dependência da IA. Durante minha conversa com o fundador da Timekettle, perguntei sobre o papel que a IA desempenha no dispositivo para saber se isso é realmente um recurso ou se a empresa está simplesmente lucrando com o recurso. Aqui está o que me disseram:
O hub X1 AI Interpreter depende predominantemente de dois modelos de linguagem. O primeiro é conhecido como TurboFast, que permite a tradução simultânea palavra por palavra nos dois idiomas. De acordo com o Timekettle, ele escolhe uma rota palavra por palavra em vez de uma rota por frase para reduzir o tempo de espera enquanto um dos usuários fala. O outro modelo é chamado BoostClean , um modelo estatístico destinado a limpar erros em um conjunto de dados, usado para suprimir o ruído de fundo.
Esses modelos de dados, de acordo com Tian, são constantemente atualizados no lado do servidor, mas sem usar quaisquer dados privados dos usuários – para aumentar a confiança de que o gadget não irá bisbilhotar suas conversas confidenciais. Também fui informado que a empresa está atualmente avaliando o uso de traduções personalizadas em cada dispositivo, para permitir que os usuários se registrem e traduzam jargões técnicos ou quaisquer termos profissionais usados em contextos muito específicos. Isso pode ser entregue como parte de uma atualização futura.
Um ótimo dispositivo que fica aquém
Os seres humanos são geralmente mais expressivos nas suas línguas nativas e é por isso que a tradução continua a ser vital para a compreensão de outras perspectivas. Ao mesmo tempo, uma biblioteca incomensuravelmente grande e em constante evolução de diferentes idiomas, auxiliada pela IA, resolve muitos problemas com ferramentas de tradução direta, especialmente em telefones .
A extensa lista de recursos do Timekettle ajuda ainda mais a facilitar a comunicação em diferentes cenários. Isso se torna ainda mais emocionante quando levamos em consideração a rapidez das traduções. Em teoria, parece uma ferramenta indispensável, especialmente para ambientes empresariais. Porém, algumas falhas impedem que ele pareça tão eficaz quanto os projetos da empresa.
O hub X1 ainda sofre com alguns problemas operacionais, principalmente repetição de frases e traduções fora de contexto. Isso pode impedir as conversas e até impactar negativamente o resultado. A outra coisa preocupante é o seu alto preço: uma única unidade custa US$ 699 , o que pode representar uma despesa considerável, seja você uma pequena startup que busca apenas impressionar clientes internacionais ou uma grande empresa que busca envolver executivos de alto escalão com uma risada mais fácil. seguido por aquele aperto de mão firme.
Certamente, isso é muito menos dispendioso quando se levam em conta os custos vitalícios e as limitações linguísticas da contratação de um intérprete humano. No entanto, a experiência de um ser humano, mesmo que seja uma língua, não pode ser superada por um dispositivo portátil. Um ser humano pode introduzir mais nuances nas conversas ou até mesmo evitar traduções diretas para evitar conflitos depois de sentir as emoções por trás do discurso – algo que a tecnologia atualmente não consegue fazer. O hub Timekettle, na melhor das hipóteses, pode ajudar intérpretes humanos.
Além dos problemas funcionais, o Timekettle AI Interpreter ainda pode parecer sem brilho, e tenho duas ideias para a marca implementar para corrigir isso. Primeiro, o gadget precisa de um recurso de detecção automática para que os usuários nem sempre precisem selecionar manualmente os idiomas antes de iniciar uma conversa. Em segundo lugar, eu realmente gostaria de usá-lo com um assistente de voz para não ter que mexer nas opções do menu, especialmente porque o espaço nessa pequena tela é limitado.
Embora eu não seja tão implacável com o hub Timekettle X1 AI como muitos revisores foram com o pin Humane AI – simplesmente porque ele não atinge esse nível de habilidade teórica inovadora – espero que a empresa resolva algumas das preocupações. Dessa forma, seria mais fácil justificar esse preço alto e realmente recomendar isso aos meus amigos e colegas que adoram conversar em linguagem corporativa.