Como um disfarce humano de Sora se tornou uma senha de trânsito?

fevereiro 25, 2024 gurinho

Will Smith mais uma vez contribuiu com um meme, da última vez foi um tapa do Oscar, desta vez foi espaguete mukbang.

Em março de 2023, um internauta do Reddit usou IA para criar um vídeo engraçado de Will Smith comendo macarrão. Seu rosto era horrível e seus traços faciais estavam deformados, o que fazia as pessoas perderem o apetite.

Em fevereiro de 2024, dois dias após o lançamento de Sora pela OpenAI, Will Smith postou um vídeo comparativo de comer macarrão no Instagram. Ele ficou mais bonito e seus movimentos alimentares tornaram-se mais decentes.

Você acha que a segunda metade do vídeo foi gerada pelo Sora? Não, o macarrão foi comido pelo próprio Will Smith, e ele fez todo o trabalho.

O pé da frente ficou chocado com a demonstração oficial de Sora, e o pé de trás viu essa dinâmica, e as pessoas ficaram em dúvida sobre quem eu sou, de onde venho e para onde vou.

Embora Sora ainda não esteja aberto ao público, a Internet tornou-se cada vez mais ridícula: os vídeos de IA estão cada vez mais próximos da realidade e cada vez mais vídeos da vida real são IA falsa.

Não sei se isso pode matar Hollywood, Sora queimou meu tronco cerebral primeiro.

Vimos mais ou menos os vídeos do desempenho estável de Sora. Ao mesmo tempo, a OpenAI também divulgou generosamente os vídeos rollover. Alguns deles são mais populares nas redes sociais, especialmente a seguinte mensagem: "Arqueólogos encontraram um punhado de carros em o deserto. Cadeira normal de plástico, cuidadosamente desenterrada e espanada".

A cadeira parece ser uma criatura pensante e respirante de outro mundo que não está limitada pela gravidade ou pelo poder humano. Ela aparece e se transforma do nada, e até mesmo leva embora secretamente um ser humano. Isso pode não ser culpa da IA, afinal, a palavra de alerta não indica se eles estão na Terra.

Se o vídeo fosse distribuído nas redes sociais, poderia ser marcado com: #streamofconscientemente, #surrealismo, #preciousvideoofearlyhumankindtamingthewildchair…

A OpenAI explicou seriamente por que o bug ocorreu: Sora não conseguiu modelar a cadeira como um objeto rígido, ou seja, um objeto que não muda de forma e volume sob a ação de forças externas, então a interação física foi imprecisa.

O vídeo de Sora sobre quebrar um copo parece ser uma arte que só pode ser vista depois de comer cogumelos venenosos. O copo na verdade se move automaticamente sem qualquer vento. O líquido sai do copo como geléia antes de quebrar. Cada passo é inesperado.

Além disso, há atletas usando esteiras ao contrário, velas de aniversário que não podem ser apagadas, lobos que aparecem e desaparecem do nada… A IA inadvertidamente fez coisas que nem o cérebro humano nem os efeitos especiais podem imaginar.

Desde o anúncio oficial do Sora, os magnatas da IA têm debatido se ele pode compreender o mundo físico.O relatório técnico da OpenAI não deixou uma posição clara, mas apenas mencionou que Sora pode simular alguns aspectos das pessoas, animais e do meio ambiente no mundo real , mas pode ser difícil simular com precisão os princípios físicos de cenas complexas, como confundir esquerda e direita e não deixar marcas de mordida após morder um biscoito.

Embora a IA ainda não tenha evoluído para um estado completo, você também pode usar sua imaginação. Vídeos de IA que ainda não estão estáveis podem ser usados como uma biblioteca de materiais para temas sobrenaturais, de suspense, de terror e de fantasia, fornecendo nova inspiração para a criação. Quanto mais você tenta levantar o caixão de Newton, mais artística se torna sua performance.

Assim como "cavar cadeiras" e "quebrar copos", eles já podem ser usados em MVs, propagandas, filmes e jogos. Ainda parece uma grande produção. Mesmo que o efeito seja estranho, é surpreendentemente suave. É melhor do que Station B. Série "Aprendeu Animação de Cinco Anos".

Mesmo que o conteúdo fosse tão mágico, alguns internautas ainda hesitaram por um segundo: “Se o bug não fosse revelado, duvido que tenha sido filmado.” “Isso é um truque de mágica?”

Isso ocorre porque até mesmo o vídeo rollover de Sora ainda pode superar “predecessores” como Pika e Runway em termos de duração, qualidade de imagem e estabilidade.

Enquanto outras ferramentas geram vídeos de no máximo 3 a 4 segundos e tentam manter uma única tomada o mais estável possível, Sora aumenta o limite superior para 1 minuto para obter uma alternância perfeita de múltiplas tomadas e manter com relativa precisão a consistência do assunto principal. e estilo visual da imagem, como se soubesse usá-la.A linguagem da lente e o ritmo narrativo contam histórias.

À primeira vista, parece que existem câmeras reais acompanhando a cena. Pessoas, objetos e cenas se movem no espaço tridimensional, e o mesmo personagem pode ter múltiplas perspectivas.

▲ Sora pode alcançar múltiplas perspectivas.

Algumas pessoas brincam que este é um salto de “imagens animadas” para “vídeos” gerados por IA.

O vídeo de Sora capotando o carro certamente pode ser contado entre eles. É como escrever um monte de código bagunçado, mas ele funciona.

Zhou Hongyi, presidente da 360, falou sobre um ponto interessante no Weibo: Sora funciona como o sonho humano. Sonharemos com coisas estranhas, mas é baseado no que vemos com nossos olhos e na experiência acumulada na vida. , não há necessidade para modelar 3D e renderizar quadro a quadro, como na indústria de cinema e televisão.

De uma certa perspectiva, a IA generativa é de fato como uma máquina de sonhos, aproximando-se cada vez mais da maneira como os humanos pensam. Ela usa várias palavras rápidas para criar respostas razoáveis ou não razoáveis com probabilidade. Independentemente de estar certo ou errado, definitivamente te dar uma resposta.

Na verdade, desde o início do ChatGPT, as pessoas querem usar IA para transformar sonhos em realidade. Existem muitas postagens no Xiaohongshu que visualizam sonhos. Embora não possam realmente restaurar o efeito na mente, eles também trazem alguns fantasmas do espiritual mundo em realidade.

No futuro, Sora poderá tornar os sonhos ou a criatividade humana mais vívidos. Ao inserir texto, imagens ou vídeos, você pode adicionar alterações de luz e sombra, ajustar o ângulo da imagem e até adicionar efeitos sonoros com "um clique"…

Não sei se a elite de Hollywood perderá o emprego. Os internautas já estão ansiosos para experimentar. Além do instinto de se envolver na pornografia, eles também têm um lugar para colocar a imaginação.

Seres humanos que riem de seu próprio fracasso usam a imitação de Sora como senha de trânsito

Além do vídeo do capotamento do carro, os outros vídeos de Sora são incríveis à primeira vista, mas não resistem ao exame minucioso de uma lupa. Os caracteres distorcidos na placa da loja, a quinta perna do gato, os passos errados da modelo…

Os insetos podem ser a última barreira entre a IA e a realidade, mas os próprios humanos querem derrubá-la.

Embora Sora ainda não esteja aberto ao público, quem vende cursos e fichas está ganhando dinheiro, e quem se diverte pregando peças também encontrou maneiras de pescar em águas turbulentas e inventou uma nova forma de atrair tráfego.

Quando postaram o vídeo nas redes sociais, adicionaram “gerado por Sora” e avisos decentes à cópia, fingindo ser feito por IA, assim como Will Smith imitando a IA imitando a si mesmo.

Estão participando pequenos videobloggers de vários circuitos. Aqueles que exibem bichinhos fofos, jogam, escolhem ídolos da Amway, anunciam produtos… eles realmente não estão fornecendo inspiração de emprego para Sora?

Entre eles, os mais difíceis de distinguir entre genuínos e falsos são, sem dúvida, os filmes de Bollywood. Os enredos e efeitos especiais dos filmes policiais indianos são particularmente surpreendentes. Eles são avançados demais para os humanos e tornam a física inexistente. Até a IA precisa aprender com eles. .

Se não fosse pelas pessoas entusiasmadas que adicionaram comentários e anexaram um link do YouTube carregado há 11 anos para provar o pioneirismo desumano dos filmes indianos, ninguém ousaria atestar isso.

Até a conta oficial da Netflix Índia entrou na diversão. Ela interceptou um clipe do filme indiano anti-britânico "RRR" e fingiu ser gerado por Sora. De acordo com o exagero usual dos sucessos de bilheteria indianos, os primeiros segundos podem de fato enganar a audiência.

Embora esses vídeos falsos de IA sejam criados por humanos e a IA misturada neles pareça comum, a IA pode não ser capaz de imitá-los.

Confundindo a opinião pública e trazendo-a sobre si, os danos continuam a ser causados por seres humanos e surgiu uma cadeia de suspeitas.

Os internautas começaram a se preocupar com o fato de que, quando as fotos geradas por IA e da vida real não são realmente claras, eles podem ter "evidências conclusivas", mesmo que não tenham feito nada.

Este é o enredo do drama britânico de suspense "Truth Capture": a agência de inteligência forjou vídeos de vigilância para condenar criminosos.

Eles acreditam que forjar vídeos de vigilância é apenas “reconstituir” provas ilegais, como materiais de escutas telefónicas, em provas legais.As coisas aconteceram e os criminosos cometeram crimes.

Mas ninguém sabe se as pessoas que usam a tecnologia ultrapassarão os limites e passarão de enxertos e enxertos para criar algo do nada.

A identificação dos métodos de resposta da IA também pode ser usada de outro ângulo, como um truque para escapar da casca da cigarra dourada.

Como a IA não é boa em desenhar mãos, havia um meme no passado em que os criminosos usavam dedos falsos para cometer crimes. Parecia que eles tinham seis dedos. Isso poderia difamar o vídeo de vigilância como sendo gerado pela IA e não poderia ser usado como provas em tribunal.

A IA está próxima da realidade, enquanto os humanos fingem ser IA. A IA também pode ser usada para falsificar provas apresentadas em tribunal e invalidar provas. Um mundo mágico onde a magia derrota a magia pode realmente estar chegando. A IA ainda não pode causar ativamente o caos, e são os próprios humanos que podem quebrar a confiança.

A IA pode ainda não ser capaz de simular o mundo, mas já afetou a forma como vemos o mundo.

Em relação à questão da IA tornar mais difícil distinguir entre o real e o falso, quando falamos sobre a mudança de rosto do Deepfake, já discutimos muito sobre isso. Como Sora poderia ser diferente?

Recentemente, a OpenAI tomou uma atitude inesperada – abrindo uma conta no TikTok e enviando os trabalhos de Sora.

A OpenAI não apenas rotula cuidadosamente cada vídeo gerado pela IA para evitar que as pessoas confundam a realidade, mas também inclui palavras imediatas.

"Um vídeo realista mostra uma borboleta que pode nadar debaixo d'água através de um lindo recife de coral" "Uma foto macro de uma folha mostra pequenos trens se movendo em suas veias" "Uma câmera próxima ao chão rastreia formigas na selva"… …

Esses vídeos são misturados com o fluxo real de informações do vídeo curto e acompanhados por música de fundo. Se você não tomar cuidado e deslizar o dedo muito rápido, isso pode ser considerado real.

Os internautas, meio brincando e meio sérios, pediram na área de comentários da OpenAI: "É melhor você fazer algo como uma marca d'água, caso contrário a humanidade estará condenada."

Sora ainda não foi lançado. Na verdade, todos estão supondo que os profissionais de conteúdo de vídeo podem ser o grupo de pessoas mais calmos porque são mais profissionais e entendem melhor os negócios. A demonstração de Sora tem muitos problemas com a consistência e precisão do conteúdo. Se não for suficiente e não cumprir os requisitos precisos da Parte A, será difícil que a tecnologia seja introduzida no processo industrial.

Mas não estou muito otimista. A IA já afetou não só a verdade e a falsidade, mas a forma como vemos o mundo. Ela não substitui diretamente um determinado software de edição, um determinado roteiro ou um determinado diretor.

O praticante de IA @Kwebbelkop especula que a OpenAI atualmente lança apenas vídeos curtos de IA no TikTok, possivelmente para coletar dados relevantes do usuário, como o número de visualizações, ajustar o modelo a partir de feedback humano e até mesmo criar uma versão de IA do TikTok no futuro.

O algoritmo de vídeo curto já é muito bom em adivinhar o que você gosta. O que acontecerá se a IA generativa for adicionada para tornar o conteúdo do vídeo mais personalizado?

No futuro, nossa experiência de assistir filmes também poderá passar por mudanças qualitativas. Em vez de depender de cinemas e streaming de mídia, grandes modelos de linguagem e modelos de geração de vídeo podem ser usados para determinar o conteúdo da história e as escalações de protagonistas.

No entanto, as expectativas da OpenAI em relação aos produtos de IA definitivamente não são apenas conversar com você e fazer vídeos, mas a ambição mais profunda é permitir que a IA aprenda a linguagem natural humana e as leis físicas do mundo.

Mesmo que se limite ao campo do vídeo, se Sora consegue fazer filmes conceituais rudimentares, já é muito impressionante. A forma de fazer vídeos, o estilo do conteúdo e até mesmo nossas preferências de conteúdo podem ser alterados por causa da IA.

Deixando de lado a IA, o telefone celular de quase todos afetou a forma como os vídeos são filmados e produzidos, permitindo que todos se tornem diretores de suas próprias vidas.

Vídeos de beleza onde você se maquia enquanto fala para a câmera, Vlogs que mostram fragmentos de sua vida pessoal, etc. são os produtos que muitas blogueiras podem filmar em seus quartos com seus celulares sob essa influência. A explosão de vídeos curtos também nos habituou cada vez mais a deslizar para cima e para baixo no telemóvel, deixando-nos menos pacientes e mais distraídos.

Embora comparadas ao Sora, ferramentas de geração de vídeo como Runway e Pika tenham recursos limitados, algumas pessoas as combinaram com ferramentas de geração de imagens como Midjourney e as usaram para fazer trailers de filmes.

Como a estabilidade é ruim, o estilo de vídeo também foi escolhido: é principalmente uma edição rápida, com narração, com foco no ritmo e no impacto visual, mas carece de diálogos entre personagens e cenas mais complexas.

▲ Curta-metragem de ficção científica de IA "Borowing Time".

Em contraste, Sora pode suportar cenas mais complexas, ações de personagens e interações entre personagens e o mundo circundante. Alguém usou o filme de amostra de Sora, depois usou a ferramenta de voz AI ElevenLabs para dublá-lo e usou o iMovie para editá-lo, para criar um "trailer do filme" mais suave que parece ser "um tiro até o fim".

Os dois tipos de vídeos que Sora exibe para o mundo exterior podem ser divididos em dois tipos. Um é a imaginação criativa, como astronautas em um planeta frio, dois navios piratas duelando no café e personagens de desenhos animados dançando discoteca. O outro é próximo. à realidade e à mineração de ouro. Califórnia durante o calor, reflexos nas janelas dos trens, o ar livre da Nigéria em 2056…

O reflexo na janela do trem é muito parecido com o que um Vlog filmaria. A cena ao ar livre na Nigéria, com a câmera passando do mercado ao ar livre para a paisagem urbana, também é muito semelhante à cena vazia de um vídeo de notícias. Alguém já planejou combinar pessoas digitais com este vídeo.

A fotografia pode até parecer desnecessária às vezes. Sora pode criar diretamente uma visão panorâmica de uma atração turística por meio de palavras imediatas, o que não é muito diferente da filmagem de um humano pilotando um drone. Nossos olhos e cérebros sabem como é a aparência de Santorini, e a IA também “sabe” disso, então pode ser deixada para a IA fazer o trabalho.

Antes havia uma metáfora muito interessante, este mundo é um enorme “Earth Online”, um RPG online multijogador massivo desenvolvido pela Solar System, com o melhor 3D a olho nu e sistema VR.

O conceito de “simulador de mundo” proposto pela OpenAI trata tudo como entrada de informação até certo ponto, absorvendo textos, imagens e vídeos, e depois emite informações, transformando texto em pinturas e imagens em vídeos, como se " "O Senhor do Earth Online", mas podemos não entender o princípio. Podemos apenas fazer o pedido e obter o resultado.

Esse futuro deve estar distante. Pelo menos por enquanto, assistir muitos vídeos de Sora deixará as pessoas entediadas. As mulheres que andam pelas ruas de Tóquio não têm emoção nos olhos e não conseguem sentir a atmosfera humana. Mas quando assistimos a vídeos curtos Às vezes também é assim, o mundo precisa de filmes sutis e aceita redundâncias enormes, assim como também se projeta a resistência do protagonista de “Matrix”.

Está chegando um futuro em que a IA se tornará cada vez mais envolvida. Da próxima vez que virmos uma suspeita de bug, não podemos julgá-lo diretamente como falso. Podemos pensar se a IA tem algum propósito aqui, assim como fazer a compreensão de leitura. Podemos não gostar, mas temos que aceitar.

Zhang Chengchen

É tão forte quanto a geada do outono e pode evitar desastres malignos. E-mail comercial: [email protected]

E-mail 8

# Bem-vindo a seguir a conta pública oficial do WeChat de Aifaner: Aifaner (WeChat ID: ifanr).Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo