Amazon revela sua nova família de modelos básicos Nova

cidade das massas
AWS

O CEO da Amazon, Andy Jassy, ​​subiu ao palco na conferência re:Invent da empresa na terça-feira para mostrar seis novos modelos de geração de texto, imagem e vídeo que chama de Amazon Nova.

Esta nova família de IAs generativas multimodais inclui a Nova Micro, um modelo somente texto construído para respostas de baixo custo e baixa latência; Nova Lite, um modelo multimodal de baixo custo para processamento de entradas de imagem, vídeo e texto; e Nova Pro, seu modelo multimodal de uso geral que combina “precisão, velocidade e custo para uma ampla gama de tarefas”, de acordo com o anúncio da empresa . O Nova Premier é o “modelo multimodal mais capaz da Amazon para tarefas de raciocínio complexas”, enquanto o Nova Canvas é um mecanismo dedicado de texto para imagem e o Nova Reel foi desenvolvido especificamente para gerar vídeo.

Os modelos baseados em texto foram otimizados em 15 idiomas diferentes. Micro oferece uma janela de contexto de 128.000 tokens, enquanto tanto o Lite quanto o Pro podem lidar com até 300.000 tokens (cerca de 225.000 palavras ou 30 minutos de vídeo). A empresa planeja expandir as janelas de contexto de seus modelos maiores para até 2 milhões de tokens no início do próximo ano. 

O Canvas permite que os usuários gerem e editem imagens usando prompts em linguagem natural. Os Reels, que irão competir com Gen-3 Alpha , Kling e Dall-E 3 , podem gerar clipes de até seis segundos de duração a partir de prompts de texto e imagens de referência. O gerador de vídeo também oferece controle de movimento da câmera, incluindo panorâmicas e zooms.

“Continuámos a trabalhar nos nossos próprios modelos de fronteira”, disse Jassy à multidão reunida, “e esses modelos de fronteira fizeram um enorme progresso nos últimos quatro a cinco meses. E pensamos que, se estivéssemos descobrindo valor neles, você provavelmente encontraria valor neles.”

Jassy também diz que esses modelos estão entre os mais baratos de operar e os mais rápidos em sua classe, embora a empresa ainda não tenha publicado dados de referência que apoiem essas afirmações. “Otimizamos esses modelos para funcionar com sistemas proprietários e APIs, para que você possa executar várias etapas automáticas orquestradas – comportamento do agente – com muito mais facilidade com esses modelos”, disse ele. “Então eu acho que isso é muito atraente.”

Os modelos Micro, Lite e Pro (bem como Canvas e Reels) estão atualmente disponíveis para clientes da AWS. A estreia está prevista para chegar no primeiro trimestre de 2025.