OpenAI lança Sora 2! É hora do vídeo GPT-3.5 AI, além de um TikTok com IA. Link para download incluso.
No primeiro dia do feriado do Dia Nacional, a OpenAI lançou diretamente uma verdadeira "bomba nuclear": Sora 2, e um novo aplicativo – Sora, que pode remodelar o cenário social.
Se Sora, há mais de um ano, nos mostrou o início do vídeo com IA, então Sora 2 nos arrasta diretamente para o sol do meio-dia, que é deslumbrante, escaldante e extremamente real.
Desta vez, não é mais apenas uma demonstração técnica, mas um novo aplicativo foi desenvolvido diretamente para a experiência do usuário final C.
A OpenAI também tomou a atitude incomum de chamar diretamente o Sora 2 de "momento GPT-3.5" para geração de vídeos por IA .
Depois de assistir ao lançamento e experimentar o Sora 2, descobri que a confiança da OpenAI desta vez é realmente bem fundamentada, e não apenas uma ostentação no estilo Ultraman.
A definição de realidade chegou a um ponto em que precisa ser revisitada . Uma nova espécie, uma nova era, começou.
Ultraman também acaba de publicar um longo artigo, acreditando que este é o momento "ChatGPT" no campo criativo e que a criatividade dará início a uma "explosão cambriana".
A APPSO foi a primeira a fornecer um resumo abrangente das principais funções, nova jogabilidade e uso do Sora 2 e do aplicativo Sora.
Sora 2:
1. A geração síncrona de áudio e vídeo é alcançada pela primeira vez: a imagem é gerada simultaneamente com o som ambiente que a acompanha, sons de interação de objetos e até mesmo diálogos contextuais.
2. Física incrivelmente precisa: permite simulações de física mais consistentes com a dinâmica do mundo real.
3. Realismo significativamente melhorado: a resolução, os detalhes e o realismo da imagem foram todos melhorados.
4. Ele pode se adaptar ao estilo desejado pelo usuário com mais flexibilidade, e a capacidade de controle do estilo é aprimorada.
5. Maior consistência e melhor conformidade com as instruções do usuário em comparação aos modelos anteriores.
Aplicativo Sora
1. Cameo: O maior destaque do aplicativo Sora é que os usuários podem integrar a si mesmos ou seus amigos em qualquer cena gerada por IA com efeitos realistas.
2. Remix: Os usuários podem remixar ou criar trabalhos secundários dos vídeos uns dos outros e criar juntos.
Como usar
1. Link para download do aplicativo Sora (Atualmente apenas iOS, não Android)
https://apps.apple.com/us/app/sora-by-openai/id6744034028
2. Versão web sora.com
3. Suporte regional: A partir de hoje, nos Estados Unidos e Canadá, outros países e regiões serão gradualmente abertos
4. Mecanismo de código de convite: Tanto o aplicativo para iOS quanto a versão web exigem um código de convite para uso. Você pode baixar o aplicativo ou visitar o site para se registrar e entrar na fila agora mesmo.
5. Preço: O Sora 2 será inicialmente gratuito e terá restrições de uso relativamente flexíveis. Usuários do ChatGPT Pro também podem experimentar os modelos de maior qualidade do Sora 2 Pro na versão web.
6. A OpenAI também lançará uma API para permitir que mais desenvolvedores participem.
Sora 2: Não mais "gerando", mas "simulando o mundo"
O principal avanço do Sora 2 é que ele evoluiu de um "gerador de vídeo" para um "simulador de mundo".
Compreender o mundo físico sempre foi o maior desafio para os vídeos de IA. Vídeos anteriores de IA frequentemente apresentavam objetos que pareciam estar entrelaçados ou flutuando de forma estranha, justamente pela incapacidade de compreender com precisão as interações no mundo físico.
No vídeo do Sora 2, os movimentos de ginástica, cambalhotas contínuas no lugar, mergulhos, etc. são todos muito naturais e alinhados com a mecânica, e os respingos de água também estão de acordo com a mecânica dos fluidos.
O objetivo final da OpenAI é construir um "simulador de mundo de propósito geral", ou seja, um que permita à IA entender as regras físicas do nosso mundo.
O Sora 2 é uma etapa fundamental nesse processo. Você pode imaginá-lo como um aluno constantemente conduzindo experimentos de física no mundo virtual, assistindo a inúmeros vídeos e resumindo as leis de Newton, a mecânica dos fluidos e a óptica.
Esta é uma capacidade extremamente importante para qualquer simulador de mundo útil: você precisa ser capaz de simular falhas, não apenas sucessos.
Esta simulação da complexidade do mundo real é a evolução mais aterrorizante de Sora 2.
Outro grande avanço do Sora 2 é que, ao gerar imagens, ele também pode gerar de forma sincronizada sons ambientes correspondentes, sons de interação de objetos e até mesmo conversas que sejam consistentes com o contexto.
Embora o vídeo e o áudio da IA sejam muito poderosos agora, a sensação de realidade proporcionada pela "integração de som e imagem" é completamente diferente, o que faz com que o vídeo da IA realmente tenha uma "alma".
Isso impõe exigências extremamente altas ao modelo. Por exemplo, se a IA gera a imagem de um gato andando sobre um teclado e miando de insatisfação, o modelo precisa saber a aparência de um gato e aprender como ele mia, conectando os dois. Ele também precisa entender a ação de "tocar no teclado" para produzir o som de "clique".
Sora também deu um grande salto em controlabilidade, sendo capaz de seguir instruções complexas em várias câmeras enquanto mantém com precisão o estado do mundo, e é relativamente bom em estilos realistas, cinematográficos e de anime.
Aplicativo Sora: Construa sua vida com IA
O aplicativo Sora suporta diretamente a geração de modelos Sora 2. O recurso mais interessante nele é provavelmente o "Cameo". Você só precisa gravar um breve vídeo e áudio (para verificação de vivacidade e captura de imagem) e pode "se inserir" em qualquer cena gerada por IA.
Num segundo você estava no escritório e no outro você poderia estar em um planeta deserto em Duna, olhando para as luas gêmeas, enquanto Sora adiciona luz e sombra realistas ao seu rosto com base na luz do deserto.
O sabor lembra um pouco a versão em vídeo do nano banana?
Todo o processo é tão simples quanto gravar um vídeo de selfie. O Sora captura sua imagem, voz e expressão, e você pode "colar" a si mesmo no vídeo gerado, como se estivesse escolhendo um adesivo, e ele será 3D, perfeito e altamente realista.
Os funcionários da OpenAI já fizeram novos amigos dentro da empresa graças a esse recurso.
Você pode participar como "estrela convidada" na mesma cena com seus amigos e encenar seu próprio sucesso de ficção científica. Esta é uma nova forma de comunicação, que evolui de texto, emojis e voz para a "experiência compartilhada" do vídeo.
No feed do aplicativo Sora, cada vídeo que você vê é gerado por IA.
Se gostar de um vídeo, basta clicar em "Remixar". Você pode modificar as palavras do prompt, trocar "Noite Chuvosa Cyberpunk" por "Tarde Ensolarada" ou usar a função "Convidado Especial" para se adicionar e se tornar o protagonista da história.
O Sora preservará a estrutura ou o estilo do vídeo original, permitindo que você o modifique e recrie, assim como republicar uma postagem do Weibo com um comentário.
É claro que esses recursos inevitavelmente levantam preocupações sobre privacidade e violação de dados.
Sora também tomou medidas para lidar com isso. Somente o próprio usuário pode decidir quem pode usar sua imagem de "convidado". O usuário pode revogar os direitos de acesso a qualquer momento ou excluir qualquer vídeo que contenha sua imagem, mesmo que seja um rascunho não publicado criado por terceiros.
A OpenAI disse que uploads contendo imagens de pessoas reais de filmes ou vídeos serão banidos ou estritamente regulamentados no estágio inicial, e o conteúdo envolvendo crianças será rigorosamente filtrado: cenas contendo crianças estarão sujeitas a limites de revisão rigorosos.
A realidade, será que ela realmente não existe dessa vez?
Sora 2 e Sora App trazem muito mais do que apenas diversão; eles estão mudando fundamentalmente nossa definição de "realidade".
O lançamento de Sora 2 pode marcar o início de uma nova era em nossa relação com a realidade. Cada um de nós ganhou a "magia" para remodelar o mundo e a si mesmo.
Agora, podemos não estar escolhendo ativamente escapar da realidade, mas a "realidade" em si está perdendo sua posição central como nosso sistema de referência de vida.
O aplicativo Sora está construindo um novo centro de realidade com uma atração extremamente forte, proporcionando a máxima diversão criativa e conexão social. Ele não oferece um "clone virtual" fora da sua vida real, mas tenta se tornar o "plano de fundo padrão" da sua vida.
Quando seus relacionamentos sociais (aventuras com amigos no mundo da IA), reconhecimento de identidade (tornar-se um super-herói no mundo virtual) e expressão criativa (remixar o mundo) acontecem primeiro nesta plataforma, o mundo físico que exige que você "desconecte" ocasionalmente para voltar e lidar com suas contas de serviços públicos se tornará uma "cópia" que só precisa ser acessada ocasionalmente.
Este é realmente o Jogador Nº 1, então o fim da OpenAI é o metaverso? Zuckerberg silenciosamente acenou com a cabeça.
A própria OpenAI admitiu que era cética em relação ao fluxo de informações gerado exclusivamente pela IA, mas ficou agradavelmente surpresa com a sensação de conexão interpessoal que isso proporcionava.
Em sua última postagem no blog, Altman declarou sem rodeios que a geração de vídeos por IA pode seguir o caminho da corrupção, o que acabará levando todos nós a sermos sugados para um "fluxo de informações inúteis" otimizado pelo aprendizado por reforço.
Ele diz que a Open AI está tentando descobrir como criar um produto que proporcione prazer sem cair nessa armadilha.
O aplicativo Sora é a primeira conquista deles. No caminho para a IA, os ganhos não devem ser apenas de produtividade; devem ser também de criatividade e alegria.
Bem-vindo a este novo mundo movido pela imaginação. Agora, a única pergunta é: você tem o código de convite?
#Bem-vindo a seguir a conta pública oficial do WeChat do iFaner: iFaner (ID do WeChat: ifanr), onde mais conteúdo interessante será apresentado a você o mais breve possível.