ChatGPT revela Sora com geração de vídeo AI de até 20 segundos
A OpenAI promete lançar seu modelo gerador de vídeo de última geração, Sora, desde fevereiro . Na segunda-feira, a empresa finalmente lançou uma versão funcional dele como parte do evento “12 Dias de OpenAI”.
“Esta é uma parte crítica do nosso roteiro AGI”, disse Sam Altman, CEO da OpenAI, durante a transmissão ao vivo da empresa.
De acordo com a equipe OpenAI, o Sora estará disponível para assinantes Plus e Pro nos EUA e em todo o mundo a partir da tarde de segunda-feira.
O YouTuber Marquis Brownlee supostamente obteve acesso antecipado ao gerador de vídeo e divulgou uma breve análise em seu canal na manhã de segunda-feira. Sora parece não ter sido construído sobre GPT-4 , como praticamente todas as outras ferramentas generativas do OpenAI são. O modelo não está disponível no site ChatGPT padrão, mas sim no Sora.com (que ainda não estava no ar até a publicação deste post).
O modelo é capaz de gerar vídeos em resoluções que variam de 480p a 1080p com duração de 5 a 20 segundos, a partir de prompts de texto ou imagens de referência. Também é capaz de editar e estender videoclipes existentes. Os assinantes do ChatGPT Plus terão permissão para até 50 gerações de clipes em até 720p por mês e menos vídeos em resoluções mais altas, cada um com cinco segundos de duração. Os usuários Pro terão permissão para gerações ilimitadas em todas as resoluções e durações de até 20 segundos. Além das ferramentas de edição, Sora também oferece um recurso de “storyboard” que permitirá aos criadores combinar vários prompts em uma única cena cinematográfica.
Brownlee observa que o modelo precisa de “alguns minutos” para gerar um clipe em 1080p, mas observa “isso também é, tipo, agora, quando quase ninguém mais o está usando. Eu meio que me pergunto quanto tempo levará quando isso estiver aberto para qualquer um usar.” Brownlee também aponta que o modelo tem dificuldade significativa em gerar adequadamente as pernas e seus movimentos, com as pernas dianteiras e traseiras trocando de posição de maneiras não naturais e incompreensíveis.
Nosso presente de Natal para você: Sora está aqui. https://t.co/JQKGgLAy6E pic.twitter.com/0c0DLl6Udf
— OpenAI (@OpenAI) 9 de dezembro de 2024
Ao contrário do Grok 2 , Sora limitará o que seus usuários podem criar e proíbe explicitamente a geração de assuntos protegidos por direitos autorais, pessoas com menos de 18 anos e qualquer coisa que contenha violência ou “temas explícitos”.
Apesar da posição de liderança da OpenAI na indústria de IA, Sora foi assolada por atrasos ao longo de seu desenvolvimento, permitindo que concorrentes como os modelos Gen-3 alpha da Runway , Kuaishou Technology e os modelos Movie Gen da Meta chegassem ao mercado. Sora também foi recentemente (embora brevemente) divulgado publicamente por um grupo de testadores beta, que acusou a empresa de “lavar a arte” das capacidades do modelo.