Tudo o que você precisa saber sobre o agente baseado em navegador da OpenAI, Operator

fevereiro 6, 2025 gurinho

A OpenAI finalmente entrou na corrida da IA de agência com o lançamento de seu Operador AI em janeiro. O sistema de agente foi projetado para funcionar de forma autônoma em nome de seu usuário e está preparado para competir contra rivais já estabelecidos no setor, como a API Computer Use de Claude e os agentes Copilot da Microsoft – pelo menos, uma vez que ele abandone seu status de “visualização de pesquisa”. Aqui está tudo o que você precisa saber sobre o novo agente da OpenAI e quando você poderá experimentá-lo.

O que é Operador?

O Operador da OpenAI é um agente AI , o que significa que foi projetado para realizar ações autônomas com base nas informações disponíveis. Mas, ao contrário dos programas convencionais, os agentes de IA são capazes de analisar as mudanças nas condições em tempo real e reagir de acordo, em vez de simplesmente executar comandos predeterminados. Como tal, os agentes de IA são capazes de realizar uma variedade de tarefas complexas e de várias etapas, desde transcrever, resumir e gerar itens de ação de uma reunião de negócios até reservar o voo, acomodações em hotel e alugar um carro para as próximas férias com base nas diversas programações de sua família até pesquisar tópicos de forma autônoma e montar estudos de várias páginas sobre esses assuntos.

O Operador funciona de maneira um pouco diferente de outros agentes disponíveis atualmente. Embora o uso do computador de Claude seja uma API e os agentes de IA da Microsoft trabalhem na própria interface de bate-papo do Copilot, o Operator foi projetado para operar em uma janela de navegador da web dedicada que é executada nos servidores da OpenAI e executa suas tarefas remotamente. Seu navegador local não tem nada a ver com o processo e pode ser usado normalmente mesmo quando o Operador está em execução.

O aplicativo Operador é alimentado por um novo modelo de “ Agente Utilizador de Computador ” (CUA) que, por sua vez, é construído sobre o GPT-4o, que fornece as habilidades multimodais do aplicativo. A OpenAI diz que o CUA foi treinado de maneira semelhante aos seus modelos de raciocínio o1 e o3. Como tal, o modelo CUA dividirá tarefas complexas em seus problemas componentes antes de tentar resolvê-los sequencialmente, retrocedendo se encontrar algum obstáculo lógico.

Quando o Operador foi lançado?

OpenAI lançou o Operator em 23 de janeiro de 2025. Atualmente, ele está disponível apenas para usuários Pro de US$ 200/mês nos EUA por meio do site operator.chatgpt.com . “Nosso plano é expandir para usuários Plus, Team e Enterprise e integrar esses recursos ao ChatGPT no futuro”, escreveu a empresa em seu anúncio .

Como funciona o Operador?

Os usuários podem ativar o agente na tela inicial do ChatGPT, que abre uma página dedicada do navegador em uma janela lateral para que o Operador execute suas tarefas. A IA fornece uma narrativa contínua do que está fazendo atualmente e o usuário pode assumir o processo a qualquer momento. A operadora solicitará a ajuda do usuário em determinadas tarefas, como fazer login em sites seguros específicos, bem como obterá a confirmação do usuário antes de executar tarefas importantes. Ele pode interagir com sites tanto visualmente (ou seja, por meio de capturas de tela) quanto taticamente, quando imita os toques do teclado e os cliques do mouse do usuário.

O que o Operador pode fazer e quão bem ele pode fazer isso?

Por ser limitado ao navegador, o Operador atualmente só pode realizar tarefas simples baseadas na Internet, como reservar ingressos para shows, solicitar o DoorDash ou preencher pedidos do Instacart. A empresa afirma ainda que o agente poderá automatizar tarefas como reserva de hotéis e companhias aéreas, reserva de mesas em restaurantes e até mesmo fazer compras online.

A OpenAI colocou o Operator contra o Computer Use da Anthropic, bem como o agente Mariner do Google DeepMind, em uma série de benchmarks do setor e afirma que o Operator os derrotou em todos os aspectos. No benchmark OSWorld , que mede quão bem um agente pode concluir tarefas como mesclar arquivos PDF, o CUA superou o Uso do Computador em 38,1% a 22,0% – para referência, os humanos têm em média cerca de 72% de sucesso nessas tarefas. No benchmark WebVoyager, o CUA superou o Mariner em 87% a 83,5%. O uso do computador obteve insignificantes 56%.

No entanto, as reações iniciais do usuário ao agente de IA foram variadas. Por exemplo, o colunista do New York Times Kevin Roost escreveu: “Ao todo, descobri que usar o Operator geralmente causava mais problemas do que valia a pena. A maior parte do que fez por mim eu poderia ter feito mais rápido e com menos dores de cabeça.”

“Mesmo quando funcionou”, continuou ele, “pediu tantas confirmações e garantias antes de agir que me senti menos como se tivesse um assistente virtual e mais como se estivesse supervisionando o estagiário mais inseguro do mundo”.

Como posso experimentar o Operador sozinho?

Para obter acesso ao agente Operador da OpenAI, você precisará se inscrever na assinatura do nível Pro da OpenAI e acessá-la através do site operator.chatgpt.com .