A Amazon Web Services revela sua linha mais poderosa de agentes de IA, capazes até mesmo de projetar foguetes.

Como o próprio nome sugere, re:Invent não é apenas o nome da conferência anual da Amazon Web Services, mas também a mensagem central que ela transmite ao mundo exterior todos os anos: neste setor, a única constante é romper com o passado.

Se a última década do re:Invent foi sobre como "remodelar" os recursos computacionais em infraestrutura prontamente disponível, como água e eletricidade, este ano enviou um sinal completamente diferente: na segunda metade da computação em nuvem, o foco da competição mudou de "fornecer recursos" para "fornecer capacidades".

Em Las Vegas, a Amazon Web Services lançou 25 novos produtos em 10 minutos, tentando responder a uma pergunta que tem incomodado o setor: por que, após dois anos de grande expectativa em torno de modelos de grande escala, o crescimento explosivo de aplicativos de nível empresarial tem demorado a chegar?

A resposta da Amazon Web Services para o mundo é: chegou a era da IA ​​Agética para empresas.

 Versão "Muito longo, não li":
A família Frontier Agents estreia: apresentando três agentes de ponta — Kiro Autonomous Agent, Security Agent e DevOps Agent — trazendo um novo paradigma de automação para desenvolvimento de software, segurança e operações.
Evolução adicional de chips desenvolvidos internamente: A Amazon lançou oficialmente os UltraServers Trainium 3, com um aumento de desempenho de 4,4 vezes. Também apresentou uma prévia do chip Trainium 4, de próxima geração e ainda mais poderoso.
A família de modelos desenvolvida internamente foi totalmente atualizada: a família de modelos Amazon Nova 2 foi lançada, incluindo quatro modelos principais: Lite, Pro, Sonic (voz) e Omni (multimodal), abrangendo todos os cenários, desde os mais simples até os mais complexos.
Amazon Bedrock adota grandes modelos chineses: A plataforma Amazon Bedrock expandiu-se ainda mais, incorporando pela primeira vez vários dos principais modelos chineses, incluindo Kimi, MiniMax e Qwen.
Uma revolução na personalização de modelos: o Amazon Nova Forge foi lançado, inaugurando o conceito de "modelos de treinamento abertos", que permite às empresas incorporar seus próprios dados na fase de pré-treinamento de um modelo base para criar modelos proprietários e altamente personalizados.
Governança do Comportamento do Agente: Implemente as políticas e avaliações do AgentCore para definir limites comportamentais para agentes de IA usando linguagem natural e avaliar continuamente a qualidade do seu trabalho, resolvendo os desafios de credibilidade e controlabilidade em aplicações de IA empresariais.
A quebra das fronteiras na nuvem: O lançamento do "Amazon AI Factories" permite que a infraestrutura de IA da Amazon Web Services seja implantada diretamente nos data centers dos clientes.

Reformulando a Produtividade: Transformando a IA de uma "Ferramenta" em uma "Colega"

Nos últimos dois anos, acostumamo-nos a chamar a IA em ambientes de produção corporativos de Copiloto, mas a Amazon Web Services acredita que isso não é suficiente. O Copiloto, ou os "assistentes" de IA tradicionais, exigem monitoramento constante e ajustes nas instruções com base em suas tarefas e desempenho; o que as empresas realmente desejam são agentes capazes de receber objetivos, pensar de forma independente e utilizar diversas ferramentas para concluir tarefas.

Portanto, nos últimos anos, a narrativa central da Amazon Web Services (AWS) mudou de fornecer ferramentas para fornecer "trabalhadores". No re:Invent deste ano, vimos a AWS dedicar a maior parte do seu tempo a Agentes de IA e revelar a sua maior estratégia de implantação de Agentes de sempre.

O valor dos agentes de IA reside em suas "ações". Eles são uma espécie completamente nova, distinta dos assistentes de IA, e dotada da capacidade de planejar autonomamente, operar por longos períodos e executar tarefas complexas em paralelo.
—Swami Sivasubramanian, Vice-Presidente de IA Agética da Amazon Web Services

O primeiro passo para a implantação em larga escala de agentes de IA é projetar "funcionários digitais" com habilidades únicas próprias.

Como manifestação concreta desse conceito, os Agentes da Fronteira foram oficialmente lançados. Entre eles, agentes como o Kiro (desenvolvedor virtual), o Amazon Security Agent (consultor de segurança) e o Amazon DevOps Agent (especialista em operações) já foram testados em diversas empresas, demonstrando excelente eficiência.

Por exemplo, o agente autônomo virtual Kiro, usado por desenvolvedores, pode se conectar ao Jira e ao Slack, compreender a lógica de negócios e os padrões de colaboração da equipe e concluir tarefas rotineiras, como alterações em bancos de dados e correções de bugs, 24 horas por dia, de maneira padronizada, permitindo que os membros da equipe se concentrem mais em aspectos inovadores importantes.

Em um caso dentro da Amazon Web Services, uma equipe de seis pessoas usou o Kiro para concluir um projeto de refatoração arquitetural em apenas 76 dias, que normalmente exigiria 30 pessoas e 18 meses. Durante esse período, o Kiro analisou autonomamente 15 microsserviços, testando e submetendo código de forma quase totalmente autônoma.

A Blue Origin, que possui laços estreitos com a Amazon, introduziu corajosamente esse processo no projeto de sistemas aeroespaciais: desde o refinamento de requisitos e a comunicação de materiais até a arquitetura de sistemas de alta tecnologia e simulação física, a Blue Origin utiliza sua plataforma interna BlueGPT para acionar múltiplos agentes que dão suporte à pesquisa e desenvolvimento, aumentando a velocidade geral de entrega em 75%.

Por trás das capacidades aprimoradas dos agentes, reside uma atualização no "cérebro" dos modelos. A família de modelos Amazon Nova, que suporta diversos agentes, foi totalmente atualizada para sua segunda geração, incluindo o econômico Amazon Nova 2 Lite, o modelo inteligente mais poderoso da Amazon, o Amazon Nova 2 Pro, o Amazon Nova 2 Sonic, com foco em diálogos de voz semelhantes aos humanos, e o primeiro modelo multimodal verdadeiramente unificado do setor, o Amazon Nova 2 Omni. A Amazon Web Services segue a filosofia de que "nenhum modelo único pode governar tudo", e essa família diversificada de modelos visa tornar os agentes mais obedientes e capazes.

Para incentivar as empresas a integrarem com confiança esses poderosos agentes em seus fluxos de trabalho principais, a Amazon Web Services criou o Amazon Bedrock AgentCore — um conjunto completo de mecanismos de governança comportamental adicionados à plataforma de criação de agentes Bedrock.

Com o recurso de Políticas do AgentCore , os gerentes podem definir "linhas vermelhas" invioláveis ​​para os agentes usando linguagem simples, como "proibir reembolsos a clientes com valores superiores a US$ 1.000", evitando que erros de IA causem perdas significativas para a empresa. O recurso de Avaliações do AgentCore oferece 13 avaliadores integrados para monitorar continuamente a qualidade do desempenho dos agentes, de forma semelhante às avaliações de desempenho. O novo recurso de Memória do AgentCore introduz a "memória contextual", permitindo que os agentes aprendam com experiências passadas e se lembrem das preferências e do contexto do usuário.

Vale ressaltar que a Amazon Web Services (AWS) também demonstra uma notável inclusão em seu ecossistema. Na plataforma Amazon Bedrock, encontramos DeepSeek, Kimi, MiniMax e Qwen. Isso significa que as empresas podem acessar facilmente os principais recursos de modelos de IA da China na infraestrutura global da AWS, como o Kimi K2, que se destaca em inferência e utilização de ferramentas, e o MiniMax M2, que se concentra em codificação.

Claramente, a próxima visão da Amazon Web Services é aprimorar a unidade de produtividade das empresas, passando de indivíduos para equipes híbridas de "pessoas + agentes", permitindo que os humanos lidem apenas com problemas realmente valiosos e liberando completamente a produtividade.

Reestruturação de custos: Reduzir os custos de poder computacional e aumentar a eficiência, rompendo o limite mínimo de preços.

Tornar a IA uma infraestrutura como água e eletricidade sempre foi um dos temas mais interessantes do setor. No entanto, muitas pessoas notaram que os custos atuais da capacidade computacional parecem muito altos, altos o suficiente para sufocar a inovação na maioria das empresas.

A principal vantagem competitiva da Amazon Web Services reside precisamente na sua capacidade de reduzir drasticamente os preços através do seu sistema abrangente e das suas excepcionais capacidades de engenharia.

Durante o discurso de abertura no primeiro dia, o CEO da Amazon Web Services, Matt Garman, anunciou o lançamento do Trainium 3 , o primeiro chip de IA de 3nm na nuvem, e também apresentou os Amazon Trainium 3 UltraServers baseados nele, que fornecem às empresas o poder computacional necessário para treinamento e inferência de IA.

Os UltraServers Amazon Trainium 3, que podem integrar até 144 chips Trainium 3 em um único sistema, oferecem 4,4 vezes mais poder de computação, 3,9 vezes mais largura de banda de memória e, o mais importante, 40% mais eficiência energética em comparação com a geração anterior. Isso significa que as empresas podem gerar 5 vezes mais tokens com o mesmo consumo de energia.

Os chips desenvolvidos internamente pela Amazon Web Services são seu ponto forte para competir com GPUs caras e uma promessa para as empresas: tornar o treinamento e a inferência de IA acessíveis a todos, em vez de serem exclusividade de gigantes. Clientes como Anthropic, Ricoh e Splash Music já reduziram seus custos de treinamento em 50% com o Trainium.

Além disso, a Amazon Web Services anunciou seu chip de próxima geração, o Trainium 4, que oferecerá 6 vezes o desempenho de computação do FP4 e 4 vezes a largura de banda de memória, superando a Lei de Moore para atender às maiores necessidades de treinamento de modelos do mundo e reduzir as preocupações com custos para as empresas.

Além de melhorar a eficiência energética do hardware, reduzir o consumo de energia computacional no lado do software também é crucial para a estratégia de custo-benefício das empresas. Nesse sentido, a Amazon Web Services demonstrou um exemplo brilhante de sinergia entre hardware e software:

A Amazon Web Services acredita que as empresas nem sempre precisam dos maiores modelos. Por isso, o recém-lançado Amazon Bedrock Model Distillation permite que as empresas usem modelos grandes (professores) para treinar modelos menores (alunos), alcançando, em última análise, desempenho semelhante a um custo dez vezes menor. Combinado com otimizações especializadas para grandes volumes de dados usando tecnologias de armazenamento e banco de dados como Amazon S3 Tables e Aurora DSQL, a Amazon Web Services está eliminando sistematicamente os custos desnecessários associados à IA.

Todas as inovações em aplicações de alto nível dependem do suporte da infraestrutura subjacente. Somente quando o poder computacional for tão barato e acessível quanto água e eletricidade, a explosão de aplicações de IA terá uma base realista.

Redefinindo Fronteiras: "Entrega Porta a Porta" Rompe as Limitações Geográficas das Capacidades da Nuvem

Durante muito tempo, uma barreira invisível separou as nuvens públicas dos centros de dados privados. Devido à soberania dos dados, à baixa latência ou aos requisitos de conformidade, muitas operações críticas de negócios em departamentos sensíveis de empresas não podem ser migradas para a nuvem, nem podem utilizar os recursos de IA mencionados anteriormente.

A Amazon Web Services decidiu derrubar esse muro.

O recém-lançado Amazon AI Factories oferece uma solução "indireta" criativa: se você não tem acesso à nuvem, eu trago a nuvem até sua casa.

Em outras palavras, a Amazon Web Services (AWS) pode "entregar" diretamente um rack de servidores completo, incluindo chips Trainium ou NVIDIA, ao data center do cliente. O que eles vendem não são apenas servidores, mas um ambiente de computação completo gerenciado pela AWS, oferecendo uma experiência consistente de nuvem pública.

A plataforma AI Factories é particularmente adequada para clientes soberanos como a HUMAIN, uma empresa de IA controlada pelo fundo soberano da Arábia Saudita (PIF), ou para setores altamente regulamentados, como o financeiro e o da saúde. Eles podem acessar imediatamente infraestrutura avançada de IA utilizando o espaço e a energia já existentes em seus data centers.

Ao mesmo tempo, a Amazon Web Services lançou o Amazon Interconnect , inicialmente em parceria com o Google Cloud, eliminando as barreiras físicas entre os fornecedores de nuvem. Isso demonstra sua abordagem pragmática: reconhecer que a "multicloud" é uma realidade e trabalhar proativamente para preencher essa lacuna.

Com isso, a Amazon Web Services (AWS) concluiu sua transformação de "provedora de serviços em nuvem" para "provedora de infraestrutura de computação onipresente". A definição de nuvem não se limita mais aos data centers da AWS, mas se estende a qualquer lugar onde os clientes precisem dela.

Reformulando a Experiência: Eliminando a "Dívida Tecnológica" e Retornando à Fonte da Criação

Qual é o objetivo final da tecnologia? É libertar a humanidade de tarefas tediosas para que possamos nos dedicar a atividades genuinamente criativas.

O ideal é maravilhoso, mas, na realidade, muitas pessoas precisam gastar seu tempo lidando com sistemas obsoletos, mais antigos do que elas próprias. No campo do planejamento urbano, existe um termo chamado "maldição da infraestrutura", que se refere ao fato de que projetos de infraestrutura de grande escala, em seus estágios iniciais, resultam em enormes custos de manutenção no futuro e "sequestram" recursos organizacionais para a manutenção de ativos antigos, impossibilitando o investimento em novas tecnologias, novas linhas ou atualizações.

Da mesma forma, empresas globais gastam até US$ 2,4 trilhões anualmente em "passivos técnicos", como a manutenção de sistemas legados e a correção de códigos desatualizados. Programadores e engenheiros de operações detestam esses trabalhos repetitivos, "sujos e cansativos", mas estão presos a eles devido à realidade.

Na re:Invent, a Amazon Web Services anunciou que usará IA para eliminar essas "tarefas desnecessárias".

A nova versão atualizada do Amazon Transform foi projetada para eliminar essas vulnerabilidades tecnológicas. Utilizando IA Agenética, ela pode atualizar automaticamente códigos obsoletos (como COBOL e versões antigas do Java) para linguagens modernas e até mesmo migrar aplicativos Windows para Linux. Comparada às atualizações manuais, sua velocidade de modernização é 5 vezes maior, reduzindo o tempo e o custo em 80%.

O Amazon Nova Forge também pode aliviar a carga sobre as empresas. Ele introduz o conceito de "modelos abertos e treinados", permitindo que as empresas integrem seus próprios dados (como documentos de design de produtos e casos de falha) com os conjuntos de dados gerais da Amazon Web Services durante a fase de pré-treinamento do modelo. Isso permite que elas treinem um modelo personalizado (Novella) que compreenda profundamente seus próprios negócios, resolvendo fundamentalmente o problema do "esquecimento catastrófico" do ajuste fino tradicional. O Reddit usou com sucesso essa tecnologia para treinar um modelo personalizado que pode identificar com precisão conteúdo inadequado, simplificando significativamente a implantação e a manutenção.

O que a Amazon Web Services faz aqui é quebrar a maldição, aproveitando a IA para realizar atualizações e manutenção de baixo custo e integrando partes valiosas de ativos antigos em uma base de conhecimento de IA proprietária.

Somente quando as empresas não sentirem o peso da "infraestrutura" é que poderão se dedicar integralmente à inovação nos negócios.

Com a computação em nuvem entrando em sua segunda fase, os planos da Amazon Web Services estão apenas começando.

Se a primeira metade da computação em nuvem foi uma "revolução de infraestrutura" que transformou computação, armazenamento e redes em algo semelhante à água e à eletricidade, com o objetivo principal de "democratização de recursos", então a segunda metade, centrada em agentes de IA, está inaugurando uma revolução de "democratização de capacidades".

A Amazon Web Services está tentando mostrar ao mercado que a competição na era da IA ​​não se trata mais de quem tem os parâmetros de modelo maiores, mas sim de quem consegue reduzir as barreiras de entrada para a IA, controlar melhor os custos e gerenciar as restrições com mais rigor.

Essa mudança significa que o foco da futura transformação digital empresarial está se deslocando da relativamente simples "gestão de processos" de migração de negócios para a nuvem para a questão da "delegação de capacidades", que consiste em confiar os objetivos de negócios a inúmeros agentes autônomos de IA.

Ajudar as empresas a enfrentar esse desafio de transformação é o valor central que a Amazon Web Services (AWS) transmitiu no re:Invent 2025: transformar a imensa complexidade tecnológica e a incerteza da era da IA ​​em uma vantagem competitiva que ofereça segurança às empresas.

Quando Matt Garman anunciou 25 atualizações de infraestrutura em apenas dez minutos, ele declarou que não se tratava apenas da impressionante eficiência de engenharia da Amazon Web Services, mas também de um sistema de IA industrial rigoroso, pragmático e poderoso. De chips desenvolvidos internamente a bases de modelos multimodais, de data centers que rompem barreiras físicas a "funcionários digitais" autônomos, a Amazon Web Services transformou a capacidade de construir sistemas complexos de IA — algo que antes era privilégio apenas de algumas gigantes da tecnologia — em um serviço padronizado que todas as empresas podem acessar sob demanda.

Nessa narrativa, as ferramentas de IA disponíveis para as empresas se tornarão cada vez mais abundantes e as barreiras de entrada, cada vez menores. Consequentemente, a "era do valor", na qual as empresas poderão usar a IA para aumentar drasticamente sua produtividade, está se aproximando rapidamente.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

ifanr | Link original · Ver comentários · Sina Weibo