Os navegadores da Web estão entrando em uma nova era em que as habilidades de IA substituem as extensões
“O navegador é maior que o chat. É um produto mais aderente e é a única maneira de construir agentes. É a única maneira de construir “fluxos de trabalho” de ponta a ponta”, esses foram os comentários do CEO da Perplexity, Aravind Srinivas, em uma entrevista recente. O cofundador da Perplexity falava sobre o futuro dos navegadores web, agentes de IA e automações em navegadores web.
Srinivas estava otimista com as perspectivas, em parte porque sua empresa já está testando um novo navegador chamado Comet. Atualmente em fase beta, somente para convidados, o navegador vem com um agente que pode lidar com tarefas complexas e demoradas em seu nome.
Pense nisso como uma ferramenta de IA, como o ChatGPT ou o Gemini, mas que reside exclusivamente no seu navegador. A abordagem do agente no navegador, como argumenta Srinivas, é mais familiar e flexível. Você não precisa lidar com as restrições habituais de permissão local e fluxo de trabalho entre aplicativos. Além disso, os navegadores funcionarão exatamente como estamos acostumados, com produtos como Chrome ou Safari.

Mas as tendências são completamente diferentes, e a maior mudança pode ser o fim das extensões de navegador em favor de habilidades de IA e agentes gerados pelo usuário. Curiosamente, as ferramentas básicas foram lançadas há mais de um ano, mas só ouvimos falar delas com a chegada de navegadores que priorizam a IA, como o Dia e o Comet.
As habilidades de IA são as novas campeãs do trabalho
Toda essa conversa sobre agentes e habilidades de IA soa como um monte de jargões técnicos, então deixe-me explicar para você. No navegador Dia , criei recentemente uma habilidade chamada "expandir". Como fiz isso, mesmo sem escrever uma única linha de código? Simplesmente a descrevi com as seguintes palavras:
“Quando uso essa habilidade e coloco um snippet, faço uma busca na deep web e obtenho todo o histórico na forma de um artigo em ordem cronológica. Busco informações apenas de veículos de notícias confiáveis.”

Eu leio e escrevo artigos para ganhar a vida, e frequentemente me deparo com trechos e eventos em artigos com os quais não estou familiarizado. Nesses casos, tudo o que preciso fazer é selecionar o texto relevante (ou copiá-lo e colá-lo na barra lateral do chat) e usar o comando "/" para invocar a habilidade "expandir".
Conforme descrito acima, o agente de IA no navegador Dia pesquisará as menções do meu alvo nos principais veículos de notícias e criará um breve relatório sobre ele em ordem cronológica. Isso me poupa um tempo precioso que, de outra forma, seria gasto em tentativas descontroladas de busca no Google.
Mas o mais importante é que nem preciso abrir outra aba e posso fazer perguntas complementares na mesma caixa de bate-papo, dentro da aba de leitura ativa. É rápido e prático. Não conheço nenhuma extensão que faça exatamente o que essa habilidade de "expandir" faz por mim.

Também não é possível. Eu o criei com um propósito e intenção específicos. E posso criar quantos eu quiser ou ajustá-lo ainda mais para se adequar ao meu fluxo de trabalho. Criei outro chamado "pesquisa", que faz referência a uma obra (ou frase) e realiza pesquisas na web consultando exclusivamente artigos científicos revisados por pares.
A comunidade de usuários do Dia está até economizando dinheiro ao criar habilidades que buscam códigos de cupom disponíveis para produtos antes do checkout. Para minhas compras na Amazon, criei uma que combina avaliações, classificações e recursos dos produtos em diferentes abas da loja, cria uma tabela de comparação e me ajuda a fazer a melhor escolha. Tudo isso com apenas uma palavra!
Outro faz uma rápida busca por erros gramaticais e clareza no guia de estilo nos meus e-mails. Há um que cria um material de leitura baseado em questionários para crianças que leciono em uma instituição sem fins lucrativos próxima, com base no material didático que preparei.
Os alunos adoram o tom divertido e lúdico das perguntas de múltipla escolha, que testam seus conhecimentos sobre assuntos atuais. Há até uma galeria oficial do Dia, onde você pode encontrar habilidades criadas por usuários do Dia, e um painel web colaborativo, onde você pode encontrar ainda mais.
Mas aqui está o principal motivo pelo qual acredito que habilidades de navegação são mais importantes do que extensões. Qualquer pessoa pode criá-las simplesmente descrevendo o que deseja. Com extensões, você precisa de conhecimento de programação e habilidades básicas sobre como a web e sua arquitetura de navegação funcionam.
Segurança é outro motivo pelo qual eu confiaria mais em habilidades de navegação do que em extensões. Há um longo histórico de extensões de navegador sendo usadas como armas, mas agentes mal-intencionados espalham malware. Um usuário comum não consegue enxergar ou entender o funcionamento interno de uma extensão e só percebe a tolice quando o dano já está feito.

A situação com as habilidades de IA em navegadores é extremamente transparente. O funcionamento exato de uma habilidade é descrito em detalhes, em linguagem natural e sem nenhuma ressalva oculta. Basta ler atentamente ou simplesmente copiar e colar e criar a sua própria com modificações adicionais. Essa abordagem é flexível, muito mais segura e coloca todo o poder nas mãos dos usuários.
Os agentes do navegador vieram para ficar
Em seguida, temos os agentes de navegador. O navegador Opera já implementou um e oferece uma versão mais avançada chamada Operator . Você também pode ter ferramentas como o ChatGPT Agent e o Comet Browser da Perplexity . Pense nele como a Siri, mas para navegação na web.
Agentes são mais adequados para tarefas complexas e demoradas. E funcionam melhor quando têm acesso aos serviços que você acessa diariamente, como seu e-mail e calendário. Por exemplo, foi isso que fiz no navegador Comet do Perplexity ontem à noite:

Verifique minha caixa de entrada e me atualize sobre todas as solicitações de entrevista com um cientista ou executivo de empresa que pretendo realizar. Concentre-se nas conversas em que expressei a possibilidade de entrevistas virtuais, em vez de uma reunião presencial.
Sem abrir outra aba, o Assistente integrado vasculhou minha caixa de entrada do Gmail, procurou os e-mails relevantes e, em seguida, me apresentou uma lista dessas interações em uma visualização bem formatada. Para maior comodidade, ele até incluiu links do Gmail com um clique para que eu pudesse abrir diretamente aquela sequência de e-mails sem precisar pesquisar manualmente.
É ótimo para muitas outras coisas. Por exemplo, durante um AMA no Twitter, eu simplesmente pedi para selecionar as respostas do palestrante e listá-las em tópicos. Isso me poupou muito tempo de idas e vindas abrindo e fechando X sequências de conversas.

Para planejar viagens, fazer compras ou até mesmo assistir a vídeos, o assistente do navegador Comet funciona perfeitamente. O único problema é que, se você precisar dele para realizar trabalhos mais pessoais, precisará fornecer acesso aos conectores. Por exemplo, para gerenciar seu Gmail, Calendário e Drive, você precisará habilitar o acesso.
Também fiz isso na minha conta do WhatsApp e funcionou muito bem no navegador Comet. Nem todo mundo se sentirá à vontade fazendo isso, e o cuidado é totalmente justificado. Para esses cenários, o Google e a OpenAI oferecem recursos de agente semelhantes para Gemini e ChatGPT, respectivamente.
Não há como voltar atrás
Assim como você cria habilidades no Dia simplesmente digitando ou narrando suas necessidades, o Gemini e o ChatGPT também permitem criar agentes personalizados para tarefas específicas. O Google os chama de Gems, enquanto o OpenAI os chama de GPTs. E sim, você pode compartilhá-los como habilidades. Usá-los é gratuito, mas para criá-los, você precisará de uma assinatura que custa US$ 20 por mês.

Criei várias Gems e GPTs personalizadas para agilizar minhas tarefas cotidianas. Para postagens pessoais nas redes sociais, criei uma Gem que divide os artigos que escrevi em partes menores, que são publicadas em cadeia no X. Da mesma forma, criei agentes personalizados para gerenciar meus e-mails.
Um dos Gems precisa apenas que eu digite "sim" ou "não" e, de acordo, ele escreverá uma resposta educada, captando todo o contexto do e-mail. Com os conectores, você pode vinculá-los a quantos serviços quiser.

A melhor parte dessas preciosidades é que você pode usá-las facilmente em navegadores de desktop e também em aplicativos móveis. Extensões exigem que você use um navegador de desktop. Alguns navegadores móveis suportam extensões, mas elas são raras.
Além disso, eles não oferecem a mesma flexibilidade e tranquilidade que as habilidades personalizadas do navegador ou agentes criados pelos usuários. O ChatGPT Agent e o Project Mariner do Google são uma nova geração de assistentes de IA feitos sob medida para tarefas baseadas na web, assim como o assistente criado no navegador Comet da Perplexity.

Ao contrário de uma extensão, eles podem lidar com fluxos de trabalho de várias etapas, e você pode assumir o controle em qualquer etapa. Além disso, você pode modificar o funcionamento interno da sua automação de navegação na web e adaptar as habilidades de IA às suas especificações exatas, algo que não é possível com extensões.
Claro, eles não são perfeitos. Ao mesmo tempo, você pode assumir o controle e concluir as tarefas quando ele não for capaz, porque nenhum agente de IA é infalível, especialmente em um momento em que os modelos de raciocínio ainda estão longe da perfeição", admite o CEO da Perplexity.
Mas a mudança é claramente evidente. As extensões de navegador não vão desaparecer da noite para o dia, mas os agentes de navegação e as habilidades de IA criadas pelos usuários vão assumir o controle. É só uma questão de tempo até que as barreiras (leia-se: taxa de assinatura) caiam!