Alexa poderá em breve ser uma coisa do passado

Pesquisadores da Carnegie Mellon University desenvolveram um sistema para interagir com alto-falantes inteligentes e outros dispositivos assistidos por voz sem usar palavras de ativação.

O sistema, que depende de aprendizado de máquina, pode ser a base para uma alternativa segura aos assistentes domésticos sempre ativos.

Como funciona o novo sistema?

As novas descobertas foram publicadas em um artigo de pesquisa [PDF] por uma equipe de pesquisa de quatro pessoas, que também forneceu um vídeo explicando como o novo modelo poderia funcionar.

A pesquisa se concentra na Direção da Voz , técnica que determina a posição e o ângulo de onde vem a fala. Isso difere dos dispositivos inteligentes de hoje, que tendem a se concentrar apenas na posição de origem de um som.

A abordagem atual também depende de uma palavra de ativação específica, e é por isso que alterar a palavra de ativação de Alexa para outra só dá a você mais uma ou duas opções.

Quando uma pessoa fala, sua voz cria ecos pela sala, que chegam a um alto-falante inteligente em momentos diferentes. Ao analisar o tempo, o volume e o espectro de frequência do som que cada eco refletido faz, o novo sistema pode prever se um usuário está falando na direção do objeto inteligente ou de costas para ele.

Juntamente com o artigo de pesquisa, a equipe também forneceu um link do GitHub para o conjunto de dados usado para treinar a rede neural. As 11.520 frases únicas no conjunto de dados foram suficientes para treinar um alto-falante inteligente a prever o ângulo que o usuário estava enfrentando com uma precisão de 90 graus.

Os cálculos necessários para determinar a direção são leves o suficiente para serem feitos no dispositivo localmente, sem conectar a um servidor remoto. A equipe de pesquisa por trás das novas descobertas espera que essa abordagem permita interações mais fluidas com dispositivos inteligentes e ofereça mais privacidade aos usuários do que alternativas baseadas em nuvem.

Não há um cronograma de quando essa tecnologia pode aparecer para uso público, mas a base existe para abolir a necessidade de wake words eventualmente. Quando você não precisa mais chamar um alto-falante inteligente pelo nome, ele realmente precisa de um? Talvez Alexa saiba a resposta.

O fim dos assistentes domiciliares personificados?

Embora essa pesquisa abra novas possibilidades empolgantes para interagir com dispositivos inteligentes, não é provável que substitua totalmente as palavras de ativação. Afinal, uma das principais vantagens dos alto-falantes inteligentes é que você pode interagir com eles apenas pela voz enquanto realiza outras tarefas.

Talvez prometa um futuro em que vários dispositivos inteligentes possam ser usados ​​no mesmo espaço. Em vez de despertar todos os dispositivos inteligentes ao alcance da voz, você poderia pedir a um único dispositivo para fornecer o boletim meteorológico em silêncio.

Ainda é cedo, mas tecnologias como essa podem tornar as interações perfeitas entre humanos e computadores da ficção científica uma realidade em um futuro não muito distante.