Sua voz agora controla totalmente este navegador de IA.
A Perplexity acaba de ativar um modo de voz aprimorado para o seu navegador Comet . Usuários de desktop já podem experimentar. Usuários de iOS terão que esperar mais alguns dias. A atualização permite controlar tudo sem usar as mãos. Abra sites, role páginas ou siga links. Tudo por meio de comandos de voz.
No computador, você pressiona Shift + Alt + V, ou Shift + Option + V no Mac. No iPhone, as mesmas ferramentas chegarão em breve, transformando o Comet no que pode ser o primeiro navegador móvel que você nunca precisará tocar.
O recurso utiliza o modelo em tempo real mais recente da OpenAI. O CEO Aravind Srinivas anunciou o lançamento no Google X e agradeceu à equipe multimodal da OpenAI. O objetivo é a navegação completa no navegador por meio de voz, e não apenas a busca por voz.
Baseado na mais recente tecnologia de voz da OpenAI
Este modo de voz utiliza o modelo gpt-realtime-1.5 da OpenAI, desenvolvido para agentes de voz de baixa latência. Srinivas atribuiu o mérito à equipe da OpenAI, e a Perplexity afirma que isso melhorou a estabilidade das chamadas de ferramentas em mais de 25%. Isso significa menos falhas quando você pede ao navegador para executar alguma ação. As vozes também soam melhor, com um ritmo que funciona bem para sessões de escuta mais longas.
Por que o controle total por voz é importante agora?
A maioria dos navegadores trata a voz como um recurso superficial. Você fala uma pergunta, os resultados aparecem e você toca na tela. O Comet quer que a voz guie você por toda a sessão. Pergunte sobre qualquer coisa que esteja na sua tela. Tente dizer "role para baixo, abra o terceiro link, resuma esta página, compare com a aba à esquerda". Sem precisar usar o teclado.
O lançamento coincide com a mudança em direção à computação ambiente. A Perplexity aposta que a web funciona melhor quando você interage com ela. O recurso já está disponível para desktop.
A Comet também adota uma postura diferente em relação à privacidade. Ela processa a voz localmente sempre que possível e não armazena o histórico de cliques na nuvem por padrão. Nenhum perfil de rastreamento de anúncios é criado a partir da sua navegação.
O que esperar nos próximos dias
Usuários de desktop podem testar o modo de voz a partir de hoje. Para iOS, o lançamento está previsto para cerca de 11 de março, de acordo com as listas de pré-venda da App Store. A verdadeira questão é se os controles parecerão naturais em tarefas reais, e não apenas em demonstrações.
A complexidade está aumentando. O Comet Assistant aprende suas preferências e pode ajudar com compras, pedidos de comida ou busca de voos com base em seus hábitos. Um gerenciador de senhas e a sincronização entre dispositivos estão em desenvolvimento. Usuários do Android aguardam essas novidades. Para o iOS, essa atualização de voz é apenas o primeiro passo.
O artigo "Sua voz agora controla totalmente este navegador com IA" foi publicado originalmente no Digital Trends .

