O Claude 4.5 acaba de ser lançado e pode durar mais de 30 horas seguidas. Nasce a IA mais viciante da história
Quando se trata de programação, você tem que olhar para Claude.
Agora mesmo, a Anthropic lançou oficialmente o Claude Sonnet 4.5.
Vamos primeiro falar sobre o desempenho do Claude Sonnet 4.5. No teste SWE-bench Verified, que avalia habilidades reais de programação, o Claude Sonnet 4.5 liderou diretamente o setor.
Ainda mais absurdo é que ele consegue se concentrar no trabalho por mais de 30 horas continuamente.
Ótimo, ótimo, a vantagem da IA substituir humanos aumentou em mais +1.
Por exemplo, se você pedir para ele escrever um aplicativo de bate-papo como o Slack ou o Teams, ele pode criar cerca de 11.000 linhas de código de uma só vez. Em comparação, o Claude Opus 4 e o Codex anteriores só conseguiam trabalhar de forma independente por no máximo sete horas.
Nas palavras da Anthropic, Claude Sonnet 4.5 é agora o modelo de programação mais poderoso do mundo – construindo agentes inteligentes complexos, operando computadores, raciocínio e matemática, todos os quais foram bastante aprimorados.
Por exemplo, no benchmark OSWorld, que testa tarefas computacionais do mundo real, ele obteve 61,4%, ficando em primeiro lugar. Há apenas quatro meses, o Sonnet 4 estava bem à frente, com uma pontuação de 42,2%, e seu desempenho melhorou significativamente em pouco tempo.
A extensão Claude Chrome da Anthropic permite até mesmo navegar em sites, preencher formulários e concluir tarefas diretamente no seu navegador, como uma pessoa real. Minhas notas nos testes de Raciocínio e Finanças também melhoraram significativamente, com todos os indicadores apresentando tendências de alta.
Com recursos tão poderosos, a Anthropic naturalmente não lançará apenas um modelo desta vez.
Especificamente:
- Claude Code adicionou uma função de "ponto de verificação", que pode salvar o progresso a qualquer momento e retornar a um estado anterior com um clique.
- A interface do terminal foi reformulada e um plugin nativo do VS Code foi lançado.
- A API Claude adiciona ferramentas contextuais de edição e memória
- A execução de código e a criação de arquivos agora estão integradas diretamente na caixa de diálogo
A Anthropic até abriu sua infraestrutura interna subjacente para construir o Claude Code, chamado Claude Agent SDK.
Como agentes inteligentes gerenciam a memória durante tarefas de longo prazo? Como projetamos sistemas de permissão para encontrar um equilíbrio entre autonomia e controle do usuário? Como fazemos com que vários subagentes trabalhem juntos para atingir objetivos? Todas essas são questões complexas na construção e no design de agentes de IA.
E com o Claude Agent SDK, agora você pode criar seus próprios produtos.
A partir de hoje, os desenvolvedores também podem acessar o claude-sonnet-4-5 por meio da API do Claude. O preço permanece o mesmo do Claude Sonnet 4, US$ 3/US$ 15 por milhão de tokens. O preço permanece o mesmo, mas os recursos são ainda maiores.
O internauta @vasumanmoza postou logo após vivenciar o ocorrido:
"O Claude 4.5 Sonnet refatorou toda a minha base de código em uma única invocação, 25 invocações de ferramentas, mais de 3.000 novas linhas de código e 12 arquivos inéditos. Ele modularizou tudo, quebrou o monolito e limpou o código espaguete. Ele quebra completamente, mas, meu Deus, é elegante." Este é um comentário de amor e ódio.
A Cursor afirmou ter observado um desempenho de programação de ponta no Claude Sonnet 4.5, com melhorias significativas, especialmente ao lidar com tarefas de longo prazo. Isso demonstra ainda mais por que muitos usuários do Cursor escolhem o Claude para resolver seus problemas mais complexos.
O conhecido blogueiro de análises Dan Shipper disse que a nova versão do Sonnet 4.5 tem uma velocidade de resposta mais rápida, maior controlabilidade e mais estabilidade em termos de experiência do usuário.
Um bom desempenho é uma coisa, mas a segurança também precisa acompanhar.
Há relatos de que o Claude Sonnet 4.5 também é o modelo de ponta mais alinhado da Anthropic até o momento.
Aproveitando os recursos aprimorados de Claude e o treinamento abrangente em segurança, a Anthropic alcançou melhorias significativas no comportamento de seu modelo, reduzindo comportamentos como bajulação, engano, busca por poder e incentivo a delírios. Além disso, a Anthropic fez avanços significativos na defesa contra ataques de injeção imediata e na redução da classificação incorreta de conteúdo.
O que é mais interessante para mim é que a Anthropic também lançou um recurso temporário de visualização de pesquisa chamado "Imagine com Claude" ao mesmo tempo que o lançamento do Claude Sonnet 4.5.
Neste recurso, Claude gera software em tempo real. Nenhum recurso é predefinido e nenhum código é pré-escrito. Tudo o que você vê é criado e ajustado por Claude na hora, conforme você interage com o software.
No entanto, "Imagine com Claude" estará disponível apenas para assinantes do Max pelos próximos cinco dias.
O portal em anexo é claude.ai/imagine.
Não há dúvidas de que a prova de IA deste ano ainda é um ano de programação competitiva.
A avaliação atual da Anthropic atingiu US$ 183 bilhões, e a receita anualizada da empresa foi de US$ 5 bilhões em agosto, mas uma parcela significativa desse crescimento se deve à popularidade do software de programação. O problema é que seus rivais de longa data, OpenAI e Google Gemini, também estão promovendo agressivamente ferramentas semelhantes para atrair programadores.
Embora a conferência anual de desenvolvedores da OpenAI esteja a apenas uma semana de distância, a Anthropic lançou o Claude Sonnet 4.5 neste momento. O momento é muito preciso e é óbvio que a intenção é pressionar seus concorrentes.
Jared Kaplan, cofundador e diretor científico da Anthropic, também disse que o modelo Opus mais avançado deve ser lançado ainda este ano: "A Anthropic tem vantagens no uso de modelos grandes e pequenos."
Mas, para ser honesto, a Anthropic tem seus próprios problemas para lidar agora.
Nos últimos dois meses, a série de modelos Claude passou por uma controvérsia sobre "degradação". Usuários relataram uma queda drástica na qualidade do raciocínio, do código, da formatação e das ferramentas dos modelos, e até mesmo usuários pagantes do Max foram afetados.
Embora a Anthropic tenha revertido urgentemente a atualização do Opus 4.1, reconhecido dois bugs independentes e declarado que "não foi uma redução deliberada de inteligência para economizar custos", uma onda de cancelamentos ocorreu em plataformas como GitHub e X porque nenhuma compensação ou reembolso foi fornecido, e muitos usuários mudaram diretamente para o Codex.
O lançamento do Claude Sonnet 4.5 é claramente uma tentativa da Anthropic de reconquistar usuários perdidos com melhorias substanciais de desempenho. O sucesso dessa iniciativa dependerá do seu desempenho nas próximas semanas.
#Bem-vindo a seguir a conta pública oficial do WeChat do iFaner: iFaner (ID do WeChat: ifanr), onde mais conteúdo interessante será apresentado a você o mais breve possível.