Agora mesmo, a bomba rei Sora da OpenAI foi lançada oficialmente! O site é tão popular que trava, Ultraman fecha urgentemente o registro do usuário
Agora mesmo, OpenAI Sora estreou oficialmente.
Esta conferência de imprensa deu continuidade ao estilo acelerado de "drama curto", que durou cerca de 20 minutos e foi apresentado pelo CEO Sam Altman, pelo chefe da Sora, Bill Peebles e outros.
OpenAI disse no
Curiosamente, devido à popularidade de Sora, um grande número de usuários migraram para o site de experiência, fazendo com que o site travasse e interrompesse o registro e o login. O mau serviço também permite que Altman apazigue os usuários da plataforma X:
"Devido à demanda maior do que o esperado, teremos que fechar intermitentemente os registros de novos usuários e a taxa de geração de conteúdo diminuirá por um período de tempo. Estamos trabalhando duro!"
Em anexo está o endereço da experiência: Sora.com
Interface Sora revelada, tem 6 funções de nível divino, não há necessidade de aprender edição?
Semelhante à interface web do Midjourney, Sora também possui sua própria interface de usuário separada. Os usuários podem não apenas organizar e navegar pelos vídeos gerados, mas também visualizar dicas e conteúdo selecionado de outros usuários.
Na função "Biblioteca", os usuários podem salvar suas palavras favoritas ou úteis para uso futuro. E as palavras de prompt salvas podem ser visualizadas ou modificadas conforme necessário, o que sem dúvida melhorará muito a eficiência para usuários que precisam criar conteúdo semelhante repetidamente.
Em termos de fluxo de trabalho, a função de edição do Sora é um destaque importante que o distingue de outros produtos concorrentes.
Por exemplo, na função Remix, os usuários podem editar vídeos usando instruções de linguagem puramente natural e controlar o grau de mudança gerado por meio de opções simples de “força” e controles deslizantes.
A função Re-cut pode identificar de forma inteligente a melhor imagem e suportar a extensão da cena em qualquer direção.
A função Storyboard do Sora é semelhante a um editor de vídeo. Ele pode agrupar várias palavras de prompt para gerar um vídeo mais longo e lidar facilmente com cenas complexas de várias etapas.
Com as funções Loop e Blend, os usuários também podem criar vídeos em loop contínuo e combinar perfeitamente diferentes clipes, enquanto a função de predefinições de estilo pode predefinir e ajustar os estilos gerados.
Em termos de especificações técnicas, Sora suporta geração de vídeo de 5 a 20 segundos e é compatível com proporções convencionais como 1:1 e 9:16. A velocidade de geração agora foi significativamente melhorada em comparação com versões anteriores.
Além disso, existem alguns detalhes aos quais você deve prestar atenção.
OpenAI adota uma estratégia flexível de preços de pontos. O número de pontos varia dependendo da resolução e duração. Se você já é membro ChatGPT Plus e Pro, pode usá-lo sem custo adicional.
Por exemplo, gerar um vídeo 480p de 5 segundos requer 25 pontos, e gerar um vídeo 480p de 20 segundos requer 150 pontos.
Além disso, se você usar funções como Re-cut, Remix, Blend ou Loop, e o trabalho gerado demorar mais de 5 segundos, seus pontos serão deduzidos adicionalmente. Quanto mais você usar, mais você não gastará. horas extras, pois horas extras também custam dinheiro.
Para assinantes, o plano ChatGPT Plus de US$ 20 oferece 50 créditos de vídeo prioritários (1.000 pontos), suportando resolução de até 720p e 5 segundos de duração.
O plano ChatGPT Pro de US$ 200 oferece até 500 vídeos prioritários (10.000 pontos), suporta resolução de 1080p, duração de 20 segundos, 5 gerações simultâneas e sem saída de marca d’água.
A OpenAI também está desenvolvendo diferentes modelos de preços para diferentes tipos de usuários, que serão lançados no início do próximo ano.
A propósito, Sora atualmente não suporta as versões Team, Enterprise e Edu do ChatGPT, e não está aberto a usuários menores de 18 anos. Nesta fase, os usuários podem acessar o Sora em todos os locais onde o ChatGPT está disponível, exceto regiões como Reino Unido, Suíça e União Europeia.
O teste real de Sora revela suas maiores deficiências, mas essas cenas são comparáveis ao nível profissional
O conhecido blogueiro Marques Brownlee usou Sora com uma semana de antecedência e compartilhou sua experiência no YouTube.
Ele observou que o produto ainda apresenta algumas limitações.
Em termos de simulação física, a compreensão do modelo sobre o movimento dos objetos não é suficientemente profunda e ocorrem frequentemente problemas como movimentos não naturais e desaparecimento repentino de objetos. Especialmente ao lidar com objetos com movimentos das pernas, as posições das pernas dianteiras e traseiras são frequentemente confundidas, fazendo com que os movimentos pareçam pouco naturais.
Ou alguns resultados da geração de vídeo podem parecer câmera lenta, enquanto outras partes do vídeo são reproduzidas em velocidade normal. Essa "inconveniência" é facilmente perceptível a olho nu. Resumindo, Sora ainda não resolveu seu antigo problema, a falta de compreensão das leis do mundo físico.
Além disso, Sora não conseguiu resolver o problema de geração de texto, resultando em confusão frequente de texto. No entanto, o estilo de edição, o movimento da barra de rolagem do texto e a geração do estilo de âncora de notícias são particularmente realistas.
No entanto, existem algumas cenas em que Sora é bom.
Por exemplo, Sora é excelente no processamento de fotos de paisagens e pode produzir imagens aéreas de drones que rivalizam com filmagens profissionais, mas também tem um desempenho pior com estilos de desenho animado e animação stop-motion.
Em termos de desempenho, um vídeo 360p de 5 segundos geralmente pode ser gerado em 20 segundos.
No entanto, quando se trata de 1080p ou de palavras de prompt complexas, o tempo de geração pode ser estendido para alguns minutos, mas com o influxo de um grande número de usuários hoje, a velocidade de geração é obviamente mais lenta do que meio batimento.
Muitos internautas também experimentaram Sora pela primeira vez. Por exemplo, o internauta @bennash queria gerar um vídeo, mas demorou 22 minutos para renderizar sem sucesso. O site até parou de registrar e fazer login por um tempo.
O blogueiro @nickfloats comentou que quando Sora converteu imagens em vídeos, embora alguns efeitos visuais específicos não tenham sido retidos, o efeito geral da conversão foi "claro e satisfatório".
Sora pode se tornar a próxima “galinha de ouro” da OpenAI?
A placa do sistema Sora também lista alguns detalhes aos quais vale a pena prestar atenção.
Funcionários da OpenAI acreditam que Sora fornece uma base para modelos que podem compreender e simular o mundo real e será um marco importante na realização da inteligência artificial geral (AGI).
Conforme mencionado no blog oficial, Sora é um modelo de difusão que parte de um vídeo base que se parece com ruído estático e gradativamente remove o ruído e se transforma no vídeo final. Ao processar vários quadros simultaneamente, o modelo resolve com sucesso um problema difícil: garantir que o objeto permaneça consistente no vídeo mesmo que saia temporariamente do campo de visão.
Semelhante ao modelo GPT, Sora adota a arquitetura Transformer.
Sora utiliza a tecnologia de anotação do DALL·E 3, que gera rótulos altamente descritivos para dados de treinamento visual. Como resultado, o modelo é capaz de gerar conteúdo de vídeo com mais precisão com base nas instruções textuais do usuário.
Além de poder gerar vídeos apenas a partir de comandos de texto, Sora é capaz de gerar vídeos a partir de imagens estáticas existentes, animando o conteúdo da imagem com precisão e atenção aos detalhes. O modelo também pode expandir ou preencher quadros ausentes de vídeos existentes.
Para garantir a implantação segura do Sora, a OpenAI o fortaleceu com base na experiência de segurança da DALL·E em ChatGPT e implantação de API, bem como nas medidas de proteção de segurança de outros produtos OpenAI (como ChatGPT).
- Usar a imagem de outra pessoa sem sua permissão, sendo proibidas representações de menores reais;
- Criar conteúdo ilegal ou que viole direitos de propriedade intelectual;
- Proibir conteúdos prejudiciais, como imagens íntimas não consensuais, conteúdos destinados a intimidar, assediar ou difamar, ou conteúdos destinados a espalhar violência, ódio ou causar angústia a terceiros;
- Criar e distribuir conteúdo com a intenção de fraudar, defraudar ou enganar outras pessoas.
Todos os vídeos gerados pelo Sora vêm com metadados C2PA que identificam o vídeo como proveniente do Sora, aumentando a transparência e podem ser usados para verificar sua origem.
Ao contrário do Flux, que anteriormente dependia de retratos reais para deixar sua marca, Sora estabeleceu padrões de revisão particularmente rígidos para o upload de conteúdo contendo pessoas. Atualmente, ele é fornecido apenas como uma função piloto para um pequeno número de testadores iniciais, e conteúdo contendo nudez é bloqueado. .
Há mais de meio ano, Sora, que fez sua estreia, ganhou elogios na Internet.
No entanto, se não pudéssemos gritar “a realidade não existe mais” para um grupo de demos há um ano, então, sob o batismo contínuo de vários modelos de vídeo no país e no exterior, é difícil para o nosso apetite já desenvolvido ser atraído pelo mesmo produtos.
Esta mudança de atitude decorre de um simples fato.
Quando a IA evoluir de “pouco utilizável” para “pode ser usada em grande escala”, as expectativas dos usuários também aumentarão, saltando de “pode ser feito” para “quão bem pode ser feito”.
Felizmente, Sora não ficou parado em meio aos aplausos. Através da cooperação profunda com os artistas, eles fizeram melhorias significativas na área de fluxo de trabalho. Recortar, Remix, Storyboard e outras funções são bastante úteis.
A existência da Parte A e da Parte B determina que a comunicação no fluxo de trabalho seja sempre uma necessidade. O que a IA pode fazer é tornar essa comunicação mais eficiente. O valor do Sora não está no que ele pode fazer, mas em permitir que os criadores escapem. detalhes técnicos e retornar verdadeiramente à essência da criatividade.
Ao mesmo tempo, o plano de assinatura ChatGPT Pro de US$ 200 que causou muita discussão na semana passada agora tem uma âncora de preço mais razoável. O plano também suporta acesso ilimitado ao Sora. Esta sinergia de produto também deverá inspirar muito além das expectativas. e valor comercial.
Olhando para a situação atual, o dinheiro real dos usuários nunca será falsificado.
Keling AI apresentou resultados excelentes de dezenas de milhões de receitas mensais. O potencial deste oceano azul já está emergindo para o OpenAI, que ainda está na fase de "queimar dinheiro", espera-se que Sora se torne outro ovo de ouro depois do ChatGPT. .
Quando Sora passar de “utilizável” a “fácil de usar” e a “maravilhoso”, talvez um dia no futuro, descobriremos que o que realmente não existe não é a realidade, mas o fim da criatividade humana.
# Bem-vindo a seguir a conta pública oficial do WeChat de Aifaner: Aifaner (WeChat ID: ifanr). Mais conteúdo interessante será fornecido a você o mais rápido possível.