Como você pode experimentar o novo modelo de visualização o1 da OpenAI por si mesmo
Apesar de meses de rumores de desenvolvimento, o lançamento do Projeto Strawberry pela OpenAI na semana passada foi uma surpresa , com muitos analistas acreditando que o modelo não estaria pronto por pelo menos semanas, se não mais tarde no outono.
O novo modelo o1-preview, e seu equivalente o1-mini, já estão disponíveis para uso e avaliação. Veja como obter acesso por si mesmo.
Estamos lançando uma prévia do OpenAI o1 – uma nova série de modelos de IA projetados para passar mais tempo pensando antes de responder.
Esses modelos podem raciocinar através de tarefas complexas e resolver problemas mais difíceis do que os modelos anteriores em ciência, codificação e matemática. https://t.co/peKzzKX1bu
— OpenAI (@OpenAI) 12 de setembro de 2024
O que é o1?
A OpenAI não escondeu suas aspirações de inteligência artificial geral (AGI), e o Projeto Strawberry (agora conhecido como “o1”) é o próximo passo da empresa em direção a esse objetivo. É o primeiro de uma nova linha de modelos de “raciocínio”, “projetados para passar mais tempo pensando antes de responder”, de acordo com um anúncio da OpenAI . Essa estratégia permite que o modelo “raciocine através de tarefas complexas e resolva problemas mais difíceis do que os modelos anteriores em ciência, codificação e matemática”.
Os modelos alegadamente raciocinam de uma forma humana, permitindo-lhes “refinar o seu processo de pensamento, experimentar estratégias diferentes e reconhecer os seus erros”, à medida que ganham experiência através da formação. De acordo com a OpenAI, o1-preview opera no mesmo nível do Ph.D. alunos de física, química e biologia, e tem desempenho semelhante em testes de referência nessas disciplinas. o1 também é adepto de problemas de codificação e matemática , pontuando 83% em um exame de qualificação para a Olimpíada Internacional de Matemática (IMO) onde GPT-4o obteve apenas 13% e alcançando o 89º percentil em uma competição Codeforces contra oponentes humanos.
aqui está o1, uma série de nossos modelos mais capazes e alinhados até agora: https://t.co/yzZGNN8HvD
o1 ainda é falho, ainda limitado e ainda parece mais impressionante no primeiro uso do que depois de passar mais tempo com ele. pic.twitter.com/Qs1HoSDOz1
— Sam Altman (@sama) 12 de setembro de 2024
o1-mini é uma versão leve do modelo padrão o1-preview. Alegadamente, sua operação é 80% mais barata do que a iteração maior, tornando-o especialmente capaz em tarefas de análise e geração de codificação.
O o1-preview está disponível para teste?
Sim, os modelos o1-preview foram lançados em 12 de setembro para assinantes do ChatGPT Plus e Teams. Os usuários empresariais e educacionais terão acesso no início da semana seguinte.
Quão seguro é o o1 contra maus atores?
Muito, ao que parece. A OpenAI supostamente desenvolveu um programa de treinamento de segurança inteiramente novo que aproveita as capacidades aumentadas de raciocínio do modelo para fazê-lo aderir de forma mais eficiente às suas diretrizes de segurança e alinhamento. A empresa observa que nos testes, onde o GPT-4o obteve 22 (de 100) na resistência às tentativas de jailbreak, o novo modelo o1 obteve 84.
Como obtenho acesso à visualização o1?
Tal como acontece com todos os novos recursos de IA generativa, a pré-visualização o1 recém-lançada está atualmente disponível apenas para assinantes pagantes. Se quiser experimentar por si mesmo, você precisará adquirir uma assinatura Plus de US$ 20/mês. Basta clicar no botão de opção Plano de atualização na parte inferior do painel de navegação esquerdo e seguir as instruções na tela para inserir seus detalhes de pagamento.
Assim que sua assinatura for ativada, selecione o1-preview ou o1-mini no seletor de modelos no lado esquerdo da página inicial do ChatGPT. Observe que o acesso é limitado, mesmo para usuários pagantes, com limite de taxa semanal de 30 mensagens para o1-preview e 50 mensagens para o1-mini. A OpenAI afirma que eventualmente disponibilizará o o1-mini para usuários de nível gratuito, embora a empresa ainda não tenha definido uma data para esse lançamento.