Agora mesmo, a OpenAI anunciou a criação do “sistema operacional ChatGPT”, e 800 milhões de usuários irão experimentar uma nova experiência
Em 2023, a OpenAI terá apenas 2 milhões de desenvolvedores ativos semanalmente e 100 milhões de usuários ativos semanalmente.
Dois anos depois, no recém-realizado Dev Day da OpenAI, o CEO Sam Altman revelou na reunião: Agora, 4 milhões de desenvolvedores estão usando o OpenAI para criar produtos, mais de 800 milhões de pessoas usam o ChatGPT toda semana e a API processa 6 bilhões de tokens por minuto.
Graças a todos vocês, a IA deixou de ser algo com que as pessoas brincavam para se tornar uma ferramenta que as pessoas usam para criar todos os dias.
Com base nessa taxa de crescimento, pode-se dizer que vencemos.
E na semana passada, a avaliação da OpenAI subiu para US$ 500 bilhões por meio de uma transação de capital de US$ 6,6 bilhões, ultrapassando a SpaceX de Musk e se tornando a startup mais valorizada do mundo.
Destaques do DevDay:
- O ChatGPT se torna um superaplicativo: aplicativos de terceiros podem ser chamados diretamente durante conversas, a IA pode recomendar ferramentas proativamente e transações no aplicativo podem ser usadas para monetização.
- O kit de ferramentas AgentKit agora está online: arraste e solte visualmente para criar fluxos de trabalho multiagentes, concluindo todo o processo, do desenvolvimento à implantação, em minutos.
- O Codex é totalmente aberto: escreva código em tempo real usando linguagem natural, ofereça suporte ao controle de voz e integração com o Slack e revise PRs automaticamente para aumentar a eficiência da equipe em 70%.
- Atualização importante da API do modelo: a API aberta GPT-5 Pro mais poderosa, custos de voz reduzidos em 70%, Sora 2 oferece suporte à geração de vídeo no produto e controle refinado.
Instale o aplicativo diretamente no ChatGPT
Hoje, a OpenAI lançou uma bomba: o ChatGPT agora pode chamar diretamente aplicativos de terceiros.
No passado, você talvez tivesse que baixar um aplicativo específico; agora, com apenas uma frase, aplicativos como Spotify e Canva podem ser chamados automaticamente na conversa e fornecem uma interface interativa que pode ser operada diretamente.
Se você já assinou um serviço externo, pode acessar sua conta diretamente no ChatGPT para uma conexão perfeita.
A partir de hoje, o programa está disponível para todos os usuários logados, exceto os da UE, nos planos Free, Go, Plus e Pro. O programa piloto inicial inclui diversos parceiros importantes, incluindo Booking.com, Canva, Coursera, Figma, Expedia, Spotify e Zillow.
A demonstração no local foi ainda mais emocionante.
Um funcionário da OpenAI abriu o ChatGPT e pediu ao Canva que criasse um pôster promocional para um serviço de passeador de cães. Em segundos, o Canva apresentou diversas opções de design.
Então esse cara pediu para gerar um PPT de apresentação de negócios com base no conteúdo do pôster – essa combinação de impactos foi suave como seda.
Em seguida, ele usou o ChatGPT para ligar para o Zillow e exibir casas à venda na região de Pittsburgh. O Zillow gerou instantaneamente um mapa interativo, e o usuário pôde fazer mais perguntas para obter mais detalhes.
O que é ainda mais inteligente é que quando o ChatGPT acha que um determinado aplicativo pode ajudar você, ele o recomendará ativamente.
Por exemplo, se você disser "me ajude a fazer uma playlist para festa", ele pode chamar diretamente o Spotify para ajudar – essa operação é realmente especial.
Por trás de tudo isso está o recém-lançado Apps SDK (Application Development Kit). Os desenvolvedores agora podem usar a prévia do Apps SDK para começar a criar seus próprios aplicativos ChatGPT.
Vale ressaltar que o SDK do Apps é baseado no Model Context Protocol (MCP), um padrão aberto que permite aos desenvolvedores conectar fontes de dados externas a sistemas de IA. Isso também significa que aplicativos desenvolvidos com esse padrão podem ser executados em qualquer plataforma compatível.
Assim como o iOS fornece o sistema operacional e a App Store cuida da distribuição e monetização, formando, em última análise, o ecossistema da internet móvel, o ChatGPT agora serve como sistema operacional, o SDK de Aplicativos serve como ferramenta de desenvolvimento e seus 800 milhões de usuários servem como base do ecossistema. Em suma, o ChatGPT está prestes a se tornar um superaplicativo.
Além disso, ainda este ano, a OpenAI abrirá um processo de envio de aplicativos, lançará um catálogo de aplicativos dedicado e anunciará mecanismos de monetização, incluindo suporte ao novo Agentic Commerce Protocol, que permite checkout e transações instantâneas no ChatGPT.
O AgentKit está aqui, tornando a criação de agentes muito mais fácil
Hoje, a OpenAI lançou oficialmente o AgentKit, um conjunto completo de ferramentas projetado para desenvolvedores e empresas.
Antes, criar um agente era um pesadelo: orquestração complexa de processos, conectores personalizados, avaliação manual e semanas de desenvolvimento front-end antes de entrar em operação. Agora, com o AgentKit, ele inclui três componentes principais:
- Agent Builder: uma tela visual para criar e gerenciar versões de fluxo de trabalho de vários agentes
- Registro de Conectores: Um local central para administradores gerenciarem dados e interoperabilidade de ferramentas
- ChatKit: um kit de ferramentas para incorporar experiências de agentes personalizáveis baseadas em chat em seus produtos
Especificamente, o Agent Builder fornece uma tela visual que permite orquestrar lógica, conectar ferramentas e configurar regras de segurança personalizadas arrastando e soltando nós. Ele também oferece suporte a execuções de pré-visualização, configurações de avaliação incorporadas e controle total de versões.
Na coletiva de imprensa, Altman também comparou esse recurso ao "Canva para criar agentes inteligentes".
A OpenAI também lançou o Connector Registry, que permite aos desenvolvedores conectar com segurança agentes a ferramentas internas ou sistemas de terceiros por meio de um painel de controle do administrador, garantindo a segurança dos dados e o controle de acesso.
O ChatKit permite que desenvolvedores incorporem facilmente agentes inteligentes baseados em chat em seus próprios produtos, sejam aplicativos ou sites, permitindo uma personalização profunda com base nos temas da marca. Exemplos de colaborações incluem Canva, LegalOn e HubSpot.
No ano passado, a OpenAI lançou o Evals para ajudar desenvolvedores a testar prompts e mensurar o desempenho de modelos. Este ano, adicionou quatro recursos poderosos: conjuntos de dados, rastreamento de pontuações, otimização automática de prompts e suporte a modelos de terceiros.
Além disso, o Ajuste Fino Reforçado (RFT) permite que os desenvolvedores personalizem os modelos de inferência do OpenAI. O RFT já está totalmente disponível no GPT-5-mini e em beta privado no GPT-5, introduzindo dois novos recursos: chamadas de ferramentas personalizadas e pontuadores personalizados.
Em apenas 7 minutos e 11 segundos, os funcionários da OpenAI criaram um assistente de IA do zero para o site do Dev Day. Eles adicionaram visualmente um agente de classificação, nós de roteamento, um agente de Sessões para gerenciar agendas de reuniões, um agente do Dev Day para lidar com consultas gerais e até implementaram proteção de PII.
Após a conclusão da configuração, quando um usuário pergunta no Agent Builder: "De qual conferência devo participar para aprender sobre a criação de um agente?", o sistema executa automaticamente todo o processo: verificando as proteções, classificando a intenção, extraindo informações dos documentos, exibindo-as usando widgets e, por fim, recomendando conferências apropriadas e relevantes.
Depois de confirmar que o fluxo de trabalho estava funcionando, ela o nomeou "Ask Frog" e o publicou para obter um ID de fluxo de trabalho.
Em seguida, integramos o agente ao código do site do Dev Day usando o componente Chat Kit React, configuramos-o com as cores, espaços reservados e dica de ferramenta de inicialização do tema Frog, adicionamos uma interface de bate-papo deslizante e colocamos um link "Pergunte ao Frog" no topo do site, disponível instantaneamente para todos os participantes.
Todo esse processo foi o mais tranquilo possível.
OpenAI inaugura oficialmente o Codex, permitindo que a IA escreva código apenas falando
Desde o início de agosto, o uso ativo diário do Codex cresceu mais de 10 vezes, e o GPT-5-Codex processou mais de 40 trilhões de tokens em três semanas após seu lançamento.
Na coletiva de imprensa, foi mencionado que, na OpenAI, quase todos os engenheiros agora usam o Codex. A equipe observou um aumento de 70% no número de solicitações de pull mescladas a cada semana, com o Codex revisando automaticamente quase todas elas.
Hoje, a OpenAI anunciou oficialmente a disponibilidade geral do Codex, trazendo três novos recursos:
- Nova integração com o Slack: delegue tarefas ou faça perguntas diretamente ao Codex em um canal ou tópico de equipe
- Codex SDK: incorpore o mesmo agente inteligente que alimenta o Codex CLI em seu fluxo de trabalho
- Novas ferramentas de administrador: visualização e gerenciamento mais intuitivos do uso do Codex em larga escala
Com o Codex SDK, você pode introduzir o mesmo Agente em seu fluxo de trabalho ou aplicativo de engenharia com apenas algumas linhas de código. O SDK atualmente suporta TypeScript e suportará mais linguagens no futuro.
A partir de hoje, a integração com o Slack e o Codex SDK estão disponíveis para usuários dos planos ChatGPT Plus, Pro, Business, Edu e Enterprise.
Os funcionários da OpenAI construíram um sistema completo de controle de câmera no palco, incluindo a construção de um servidor Node, a escrita de toda a lógica de processamento de pacotes UDP e até mesmo realizaram com sucesso a tarefa de controlar a câmera com um controle do Xbox, além de controlar a câmera e as luzes do local por meio da comunicação com a IA.
Por fim, o apresentador apresentou os recursos de programação em tempo real do Codex SDK, usando comandos de voz para solicitar à IA que chamasse o Codex para modificar o código do aplicativo React em tempo real, criando um efeito de legenda com rolagem cinematográfica. Toda a demonstração foi realizada em linguagem natural, sem a necessidade de escrever uma única linha de código.
O modelo e a API foram totalmente atualizados. Esta onda está muito boa.
O GPT-5 Pro abre oficialmente o acesso à API para todos os desenvolvedores.
Este é o modelo mais inteligente já lançado pela OpenAI. É particularmente adequado para lidar com tarefas complexas que exigem alta precisão e raciocínio profundo. Suas áreas de aplicação abrangem áreas profissionais como finanças, direito e medicina.
Em termos de fala, a OpenAI também lançou o gpt-realtime-mini, que reduz o preço em 70%, mantendo a mesma qualidade e expressividade da fala.
Sam Altman enfatizou particularmente que a voz se tornará uma das principais formas de as pessoas interagirem com a IA.
O que é mais notável é que a versão de pré-visualização da API do Sora 2 foi lançada oficialmente, e os desenvolvedores agora podem gerar vídeos de alta qualidade diretamente em seus próprios produtos.
A API do Sora 2 é muito flexível, permitindo que os desenvolvedores controlem a duração, a proporção e a resolução do vídeo, mixem e cortem vídeos facilmente, e todos os vídeos são equipados com efeitos sonoros sincronizados e totalmente realistas.
No final da coletiva de imprensa, Sam Altman enfatizou em seu resumo que o desenvolvimento de software foi encurtado de um longo ciclo de meses ou anos para apenas minutos.
Os desenvolvedores não precisam mais de uma equipe grande; eles só precisam de uma boa ideia para transformá-la rapidamente em realidade.
A cadeia de ferramentas completa demonstrada durante a conferência, do Apps SDK ao AgentKit e ao Codex, é construída sobre essas poderosas APIs de modelo.
Devo dizer que este Dev Day contém muitas informações.
Esta onda de atualizações do OpenAI abrange quase todas as áreas com as quais os desenvolvedores se preocupam – da ecologia de aplicativos às ferramentas de agentes, dos assistentes de código à geração de vídeos, sem perder nenhuma.
Lançamentos de produtos de ponta costumam ser muito simples e despretensiosos.
Por fim, qual função você considera mais prática? Sinta-se à vontade para compartilhar sua opinião na seção de comentários.
#Bem-vindo a seguir a conta pública oficial do WeChat do iFaner: iFaner (ID do WeChat: ifanr), onde mais conteúdo interessante será apresentado a você o mais breve possível.