Os navegadores de IA estão aqui e você precisa aprender a usar a web corretamente

Há cerca de um mês, fiz uma demonstração técnica para um grupo de calouros sobre como criar uma habilidade personalizada em um navegador de IA e automatizar o trabalho de pesquisa em tarefas. Em vez de sobrecarregá-los com a busca inútil na Pesquisa Google, o "agente de IA" limitou sua busca a apenas algumas fontes acadêmicas e de aprendizagem para fornecer a resposta.

Fiz tudo simplesmente digitando "/course", seguido de "Lei da Indução de Faraday". O resumo e as respostas oferecidas pelo navegador eram estritamente do programa escolar, sem nada muito profundo ou superficial. Toda a abordagem é rápida, eficiente e elimina a imprevisibilidade de uma IA que apenas despeja jargões de fontes ruins ou simplesmente tem alucinações.

O grupo, que incluía meu irmão, ficou surpreso. Era uma maneira totalmente nova de encontrar informações relevantes na web. Em vez de ter um chatbot de IA genérico fazendo o trabalho usando sua própria compreensão de qual fonte é boa ou vale a pena ignorar, eles agora podem ditar exatamente de onde querem que suas respostas sejam obtidas.

É um mundo totalmente novo e uma reimaginação radical de como interagimos com navegadores da web. O ChatGPT Atlas da OpenAI , o Dia, o Comet da Perplexity — e, até certo ponto, o Google Chrome e o Microsoft Edge — estão avançando firmemente nessa direção. Aqui está uma breve introdução às maneiras mais notáveis ​​pelas quais os navegadores de IA estão mudando o jogo.

O fim da desordem do navegador

Os navegadores antigos limitam as informações que você pode absorver na mesma aba. Para pesquisas de contexto, perguntas contextuais ou apenas para verificar um fato básico, você deve abrir outra aba ou uma nova janela.

Em suma, as tarefas rapidamente se tornam confusas. Os navegadores com IA resolvem esse problema com um painel lateral persistente, onde você pode conversar com um assistente integrado sobre o que está aparecendo na tela, sair do assunto para pesquisar informações complementares, extrair informações de outras abas e fazer muito mais no mesmo lugar.

Recentemente, li um artigo sobre uma inovação que essencialmente transforma concreto em um dispositivo de armazenamento de energia. O artigo discutia todas as maneiras pelas quais isso poderia ser implementado, e uma dessas propostas era o sequestro de carbono. Eu não tinha muita certeza, então simplesmente abri o assistente ChatGPT integrado no painel lateral e perguntei: "O que é sequestro de carbono?"

Recebi minha resposta no painel lateral e fiz mais perguntas, incluindo uma explicação visual usando um diagrama criado pelo gerador de imagens integrado. Tudo isso aconteceu no painel lateral, sem precisar alternar entre várias abas e janelas.

Indo um passo além, posso iniciar uma pesquisa completa na web no mesmo painel lateral, criar um relatório abrangente de Pesquisa Aprofundada e adicionar minhas próprias fontes (de serviços conectados como Gmail, Drive, Notion, etc.). Também posso entrar no Modo Agente e trabalhar.

Nesse contexto, habilitei o modo de navegação autônoma e pedi que ele puxasse todos os artigos publicados pelo MIT sobre o tema de concretos inteligentes que também podem armazenar energia. Em cerca de dois minutos, obtive uma longa lista desses artigos organizada em uma tabela, com um resumo e o subdomínio do MIT que os publicou.

Tudo isso aconteceu em segundo plano, enquanto eu continuava trabalhando em outra aba. A barra lateral dos navegadores com IA — seja o ChatGPT no Atlas, o Gemini no Chrome ou o Copilot no Edge — é uma ferramenta dramaticamente avançada que simplifica o trabalho árduo das tarefas baseadas na web e também economiza muito tempo.

Conduzindo navegadores, do jeito que você quer

Uma das ferramentas mais impressionantes disponíveis atualmente nos navegadores de IA é o sistema de criação de habilidades e atalhos personalizados. Pense neles como comandos únicos que executam uma tarefa específica. Essas tarefas podem ser o que você quiser e funcionar exatamente da maneira que você as descreve.

Por exemplo, criei um GPT personalizado chamado "Assistente de Pesquisa". Quando o invoco usando o comando "/", ele executa a tarefa descrita em uma nova aba ou na barra lateral do assistente na mesma janela. Um sistema semelhante, chamado atalhos e habilidades, também está disponível no Comet e no Dia. A imagem acima mostra um exemplo de criação de um no navegador Comet.

Veja como funciona. Você escolhe um nome aleatório, descreve o que deseja fazer em um navegador e clica em salvar. Por exemplo, criei uma para compras, chamada, bem, "compras". E aqui está a melhor parte. Você simplesmente descreve o que deseja que a habilidade faça, e ela será configurada como tal.

Recentemente, eu estava dando uma olhada em um par de fones de ouvido sem fio na Amazon, mas queria comparar o preço em outros sites também. Em vez de abrir cada site de compras e pesquisar manualmente o produto, simplesmente digitei "/shopping" na barra lateral do assistente na mesma aba, e ele me deu uma lista de todos os sites que vendem o mesmo par de fones de ouvido, juntamente com o preço e o link.

Da mesma forma, o agente do navegador não só pode expandir as consultas do usuário em várias abas, como também combinar informações de todas as abas ativas. Por exemplo, se você tiver listagens de hotéis abertas em meia dúzia de abas, basta usar o atalho "@" na barra lateral e pedir ao assistente para resumir todas as informações cruciais, como preço, comodidades, disponibilidade por data, distância do aeroporto e muito mais.

A ideia, mais uma vez, é extrair contexto das abas ativas. E, graças à percepção multimodal, a IA também consegue entender texto e imagens. Por exemplo, ao olhar para a foto de uma refeição, a IA pode informar os ingredientes e informações nutricionais, ou listar todos os pontos turísticos da cidade olhando para a imagem de um mercado jordaniano.

Você só precisa perguntar.

As habilidades de IA oferecem um nível sem precedentes de controle e conveniência, combinadas com o recurso da barra lateral descrito acima. Este é um sistema de automação imensamente poderoso que pode economizar muito tempo, navegação cansativa, alternância de abas e desorganização.

O lado assustador dos navegadores de IA

Um dos aspectos mais promissores dos navegadores de IA é sua capacidade de se conectar a serviços de terceiros e entregar o controle aos chatbots de IA. Por exemplo, o Comet e o ChatGPT da Perplexity também podem se conectar à sua caixa de entrada do Gmail, WhatsApp, Slack, serviços de armazenamento em nuvem e muito mais.

Com o modo agente, você pode fazer compras ou reservas com apenas um prompt de texto. Ele funciona de forma autônoma, processando os cliques e digitações em seu nome. É bem surreal ver isso em ação, mas é aí que os problemas começam.

É possível confiar dados confidenciais, como credenciais de login, a um agente de IA (e a um navegador integrado) ? No ChatGPT Atlas, por exemplo, o navegador registra não apenas sua atividade de navegação na web, mas também seu histórico de bate-papo. E a maneira como ele registra todas essas informações é extremamente assustadora. Isso abre um novo mundo de publicidade hiperpersonalizada e riscos à privacidade.

Os especialistas também estão cautelosos com os riscos, não apenas para o padrão tradicional de atividade na web, mas para toda a nova superfície de ataques que foi aberta pelos chatbots e navegadores de IA.

“Quanto mais poder os usuários atribuem à IA, maiores os riscos. Se o navegador de alguém puder encomendar produtos online, sempre será possível para um invasor malicioso forçá-lo a enviar outro produto — potencialmente algo desagradável ou até perigoso — para aquele endereço”, disse Leo Feinberg, cofundador e CEO da Verax AI, ao Digital Trends.

Além dos riscos óbvios de alucinação (também conhecida como divulgação de informações incorretas ou fatos inventados) e viés, existem sérios riscos de segurança associados à navegação na web orientada por IA. O pessoal da Brave Software Inc. descobriu um risco de injeção rápida no navegador Comet da Perplexity.

Em um relatório subsequente, o criador do navegador homônimo, centrado na privacidade, detalhou uma vulnerabilidade semelhante em outro navegador com inteligência artificial. "Se você estiver conectado a contas confidenciais, como seu banco ou seu provedor de e-mail, no navegador, simplesmente resumir uma publicação do Reddit pode fazer com que um invasor roube dinheiro ou seus dados privados", informou . O alvo pode ser sua operação bancária, dados médicos, dados armazenados em unidades de nuvem, caixa de entrada de e-mail e muito mais.

Johnny Hughes, CMO e presidente do Conselho de IA da empresa de comunicações orientada por IA Avenue Z, disse à DigitalTrends que a navegação na web está evoluindo além da busca manual e das palavras-chave para o formato de conversação, assim como interagimos com chatbots de IA para encontrar respostas. Curiosamente, ele observou que não há um lado positivo ou negativo definitivo em incorporar IA à experiência principal de navegação na web.

"Essas ferramentas são mecanismos contextuais treinados com base em nossos comportamentos, entradas e consultas. O que acontece quando seu navegador sabe mais sobre você do que seu parceiro?", acrescenta. Os riscos são graves. Em agosto, conversas de usuários com o ChatGPT e o chatbot Grok, da xAI, vazaram, expondo milhares de conversas na Pesquisa Google. Na época, especialistas apontaram que os chatbots representam um desastre de privacidade ainda maior do que os navegadores.

Misturar os dois certamente parece uma receita calamitosa. "Se alguém estiver considerando ser um dos primeiros a adotar, recomendo usar essas ferramentas com cautela, concedendo permissões mínimas e bloqueando suas capacidades para ações potencialmente prejudiciais", alerta Feinberg, cuja empresa trabalha na intersecção entre IA e segurança.

Um engenheiro de uma empresa de IA, falando sob condição de anonimato, me disse que, apesar de trabalhar com produtos de IA para o consumidor, eles têm receio de conectar todos os serviços que você usa a um único ecossistema de chatbot. Assistentes de IA são muito mais pessoais do que navegadores da web, e vinculá-los a outros produtos que você usa diariamente — da Amazon ao Spotify — é como deixar uma empresa de IA registrar toda a sua vida.

É preciso traçar um limite, um limite onde seja possível equilibrar a conveniência dos navegadores de IA com seus riscos à privacidade. A mudança, no entanto, é inevitável.