Essa tecnologia de IA consegue entender palavras que nem sequer são ditas em voz alta.

Pesquisadores da Universidade de Ciência e Tecnologia de Pohang (POSTECH) desenvolveram uma tecnologia vestível inovadora capaz de converter a fala silenciosa em voz audível, através da leitura de movimentos sutis dos músculos do pescoço. O estudo, liderado pelo Professor Sung-Min Park e pelo Dr. Sunguk Hong, foi publicado na revista Cyborg and Bionic Systems, representando um avanço significativo na comunicação entre humanos e máquinas.

Dos movimentos musculares às palavras faladas

A inovação baseia-se numa ideia simples, mas poderosa: a fala não se resume apenas ao som. Quando uma pessoa fala – ou mesmo tenta falar em silêncio – ocorrem movimentos mínimos nos músculos e na pele ao redor do pescoço. Esses movimentos formam uma espécie de “mapa invisível” da fala pretendida.

Para capturar essa informação, os pesquisadores criaram um dispositivo vestível chamado sensor de mapeamento de deformação multiaxial. O sistema combina uma câmera em miniatura com silicone flexível contendo marcadores de referência, permitindo detectar até mesmo as menores deformações da pele. Projetado para uso diário, o sensor pode ser usado confortavelmente no pescoço e se recalibra automaticamente quando reposicionado.

Os dados coletados são então processados ​​por inteligência artificial, que interpreta os padrões de tensão vocal e reconstrói as palavras ou frases pretendidas. Ao combinar isso com a síntese de voz treinada no perfil vocal do usuário, o sistema consegue gerar uma fala que se assemelha muito à voz natural da pessoa – mesmo quando nenhum som é produzido.

Um salto prático em relação aos sistemas existentes.

Os métodos tradicionais de restauração da voz dependem de tecnologias como a eletromiografia (EMG) ou a eletroencefalografia (EEG), que geralmente exigem equipamentos volumosos e podem ser desconfortáveis ​​para uso prolongado.

A abordagem da equipe POSTECH elimina essas barreiras ao oferecer uma alternativa leve e vestível. Nos testes, o sistema demonstrou alta precisão na reconstrução da fala, mesmo em ambientes ruidosos, como ambientes industriais onde os microfones convencionais apresentam dificuldades.

Impacto no mundo real e potencial futuro

As implicações dessa tecnologia são de longo alcance. Ela poderia fornecer uma nova via de comunicação para pacientes que perderam a voz devido a danos nas cordas vocais ou cirurgia laríngea, permitindo que eles "falem" novamente usando seu próprio perfil vocal.

Além da área da saúde, o sistema poderia viabilizar a comunicação silenciosa em ambientes onde falar em voz alta é impraticável – como bibliotecas, reuniões ou locais de trabalho ruidosos. Ele também abre caminho para interfaces humano-IA mais naturais, onde a intenção pode ser traduzida em fala sem vocalização física.

Olhando para o futuro

Os pesquisadores pretendem aprimorar a tecnologia para uma implementação mais ampla no mundo real, melhorando a precisão e expandindo as capacidades linguísticas. Versões futuras poderão se integrar de forma mais fluida com dispositivos de consumo, transformando potencialmente a maneira como as pessoas se comunicam em contextos pessoais e profissionais.

À medida que a IA continua a se fundir com a tecnologia vestível , inovações como esta sinalizam uma mudança em direção a formas de interação mais intuitivas e discretas – onde até mesmo palavras não ditas podem finalmente ser ouvidas.