Pela primeira vez em um século, as Olimpíadas se tornaram “de código aberto”! A Alibaba Cloud AI concedeu “convites” para 8 bilhões de pessoas participarem.

É provável que seus feeds de redes sociais e suas próprias redes sociais tenham sido inundados com imagens geradas por inteligência artificial no estilo Ghibli mais de uma vez no último ano: imagens geradas por IA no estilo Ghibli tomaram conta das plataformas de mídia social, e bananas misteriosas provocaram um frenesi na internet, resultando em um tráfego massivo e constante.
Em nítido contraste com o crescimento vibrante dos modelos baseados em imagens, os modelos de vídeo, embora ocasionalmente produzam sucessos impressionantes e tornem difícil distinguir entre o Will Smith real e o falso comendo macarrão, continuam sendo principalmente brinquedos para nerds.
Olivia Moore, sócia da a16z, compartilhou dados alarmantes que revelaram que a taxa de retenção de usuários do Sora 2 em 30 dias foi de apenas 1%, e sua taxa de retenção em 60 dias caiu para zero.

O motivo disso é que a maioria dos produtos de geração de vídeo se concentra em tornar as ferramentas poderosas e depois espera que os usuários explorem seu uso. Criar um vídeo bacana é fácil, mas o que acontece depois que ele é gerado? Para quem enviar? Por que enviar? Quando as pessoas comuns sentem vontade de "criar um vídeo"?
Após observar diversas competições relacionadas à geração de vídeos com IA, a APPSO se perguntou se, além de usar IA para criar filmes ou comerciais, existiriam maneiras mais práticas de nos incentivar a criar vídeos com IA da mesma forma que publicamos no WeChat Moments ou no TikTok.
Acredite ou não, recentemente me deparei com uma competição de conteúdo gerado por IA bastante peculiar. O Comitê Olímpico Internacional, em colaboração com a Alibaba Cloud, organizou a "Competição Global de Conteúdo Gerado por IA dos Jogos Olímpicos de Inverno de Milão". Para participar, basta inserir uma frase no modelo de Big Data da Wanxiang e gerar um vídeo de 5 a 15 segundos sobre os Jogos Olímpicos de Inverno. Não são necessários equipamentos profissionais, conhecimento técnico ou mesmo habilidades de esqui; tudo o que você precisa é de uma ideia criativa.



▲Captura de tela do site oficial dos Jogos Olímpicos Internacionais
Para ser sincero, eu costumava pensar que esportes e IA não tinham nada a ver um com o outro; eu queria ver suor e músculos de verdade. Mas depois de experimentar, tive uma impressão diferente.
O que torna isso interessante não é o fato de ser apenas mais uma competição de IA, mas sim o fato de proporcionar um excelente exemplo de observação: o que acontece quando a IA generativa mais avançada colide com os Jogos Olímpicos, que têm um século de existência, são os mais meticulosos em relação às regras físicas e os mais exigentes em termos de apresentação visual?
Isso não é mais apenas uma autogratificação dentro da comunidade de IA; o que se segue é um "teste público" para bilhões de pessoas em todo o mundo.
Os Jogos Olímpicos de Inverno: um "teste de estresse infernal" para vídeos com IA.
Você pode se perguntar: com tantos eventos esportivos, por que escolher os Jogos Olímpicos de Inverno para esta competição de IA?
Se você analisar a lógica subjacente à tecnologia de geração de vídeo, descobrirá que é uma escolha extremamente "radical". Isso porque, em comparação com outros eventos, os Jogos Olímpicos de Inverno são naturalmente o maior desafio para a IA.
Os modelos atuais de geração de vídeo são mais vulneráveis a dois fatores: a consistência do movimento em alta velocidade e as leis complexas da física de fluidos/partículas.
Nos Jogos Olímpicos de Inverno de Pequim 2022, Gu Ailing, de 18 anos, conquistou a medalha de ouro na prova de big air do esqui estilo livre feminino. Suas palavras, "Não quero vencer ninguém, só quero ser a melhor versão de mim mesma", juntamente com o momento em que ganhou a medalha de ouro, tornaram-se um clássico na história olímpica.

Esportes como patinação de velocidade em pista curta, bobsleigh e saltos acrobáticos envolvem velocidades extremamente altas e movimentos amplos. Os modelos tradicionais de IA são propensos a erros físicos, como distorção de membros, recorte ou teletransporte, ao processar esses cenários.
A competição global AIGC nos Jogos Olímpicos de Inverno de Milão limitou a duração dos vídeos a 15 segundos, o que representa o teste de estresse mais exigente para a tecnologia de grande porte da Wanxiang. Vídeos mais longos podem usar a construção narrativa para disfarçar falhas de geração, mas dentro do limite de 15 segundos, praticamente não há espaço para erros. Cada quadro é analisado minuciosamente, e a tolerância a erros é extremamente baixa.
Isso significa que a IA deve gerar vídeos que estejam em total conformidade com as leis da física, garantindo não apenas a continuidade do movimento em alta velocidade sem travamentos, cortes ou fantasmas, mas também que o desfoque de movimento corresponda aos efeitos ópticos reais — esses requisitos impõem uma pressão muito maior sobre o desempenho do modelo do que gerar um clipe estático de paisagem.

Nos testes práticos, utilizei o Wan2.6 para gerar uma imagem de "Dawan Chicken Skiing" e, em seguida, convertê-la em um vídeo também com o Wan2.6. A trajetória dos flocos de neve, o balanço do corpo, a sensação de dinamismo e o nível de detalhe superaram minhas expectativas. Era praticamente impossível perceber que a imagem havia sido criada por IA.
O "Dawan Chicken" consegue percorrer as pistas de esqui, mantendo a continuidade e a consistência de seus movimentos em diversos estilos e temas. Experimentei o estilo Van Gogh, o estilo de quadrinhos, o estilo de ficção científica e o estilo de pintura a óleo, e todos ficaram incríveis!

A julgar pelos efeitos dinâmicos, o desempenho geral deste gatinho é bastante bom, tanto em termos da textura de sua pelagem quanto da dinâmica de seu voo planado.

Expandindo ainda mais os limites do estilo, este snowboarder experimenta cenários mais dinâmicos. É evidente que a pequena figura colorida no vídeo mantém um excelente equilíbrio enquanto desliza, demonstrando a facilidade e a habilidade de um esquiador experiente, sem o efeito de flutuação comumente visto em vídeos de snowboard gerados por IA.

O avanço tecnológico mais importante reside na capacidade de gerar referências multimodais.
O Wanxiang 2.6 consegue realizar reconstrução de personagens com nível de fidelidade ao original, capturando com precisão as características da imagem enviada pelos usuários. Ele pode usar diretamente a imagem e a voz do vídeo de entrada como referência para a criação secundária, seja de uma pessoa ou de um personagem antropomórfico, podendo ser o protagonista sem problemas, mesmo em cenas com vários personagens ou com pessoas e objetos no mesmo quadro.

Além disso, vem com sua própria biblioteca de personagens de IA, apresentando figuras familiares como o Rei Macaco, Guan Yu, gatos e cachorros, estudantes de educação física e garotas estilosas. Digitei casualmente "@O Rei Macaco salta de uma rampa de esqui de uma plataforma em grande altitude" e ele gerou instantaneamente um vídeo de esqui coerente e lógico baseado na imagem do Rei Macaco.
Ao mesmo tempo, a capacidade inteligente de múltiplas câmeras do Wanxiang 2.6 também resolve o problema da "limitação de câmera única" dos modelos convencionais de geração de vídeo. Ele pode gerar um fluxo de vídeo coerente contendo múltiplas tomadas em uma única tarefa. Combinado com a capacidade nativa de sincronização audiovisual, até mesmo usuários não profissionais podem produzir facilmente trabalhos audiovisuais completos.
vídeo
A dificuldade aumenta então para uma perspectiva em primeira pessoa extremamente desafiadora, com um esquiador segurando uma câmera de ação e descendo em alta velocidade. A câmera precisa capturar expressões faciais sutis enquanto também mantém o foco no esquiador atrás e à direita. Surpreendentemente, a filmagem permanece nítida mesmo nesta complexa cena dinâmica com múltiplos participantes.
vídeo
É claro que a maturidade da tecnologia reduziu significativamente as barreiras de entrada, mas isso não significa que a intensidade da concorrência tenha diminuído.
As competições tradicionais de IA geralmente exigem habilidades de programação, equipamentos profissionais e muito tempo investido, enquanto esta competição requer apenas uma frase de apresentação, um navegador e alguns minutos. Quando a barreira das ferramentas é eliminada, o foco da competição passa de "habilidade técnica" para "expressão criativa".
Quando as ferramentas são suficientemente poderosas, elas podem devolver a iniciativa da competição à imaginação humana — essa é a lógica central da Competição Global da AIGC nos Jogos Olímpicos de Inverno de Milão, e também reflete a proposta central destes Jogos Olímpicos de Inverno: "É A SUA VIBE".

Transformar sua criatividade em uma história olímpica não é tão simples quanto parece.
Com o desenvolvimento de modelos de geração de vídeo por IA, a tecnologia deixou de ser o maior obstáculo. O modelo de grande porte da Wanxiang consegue lidar com cenas de movimento em alta velocidade, realizar geração de referência multimodal e alcançar funcionalidade inteligente com múltiplas câmeras — capacidades que já são bastante robustas.
No entanto, tecnologias poderosas exigem infraestrutura de suporte para serem realmente implementadas. Essa é uma diferença crucial, mas que muitas vezes passa despercebida: os fabricantes de modelos 3D podem apenas fornecer recursos de geração, mas, desde a entrada de comandos pelo usuário até a exibição final da obra, há uma série de etapas intermediárias, como armazenamento, renderização e distribuição.
A aplicação em larga escala da tecnologia de IA de nível olímpico da Alibaba Cloud à interação com os fãs está essencialmente estabelecendo um mecanismo de produção de conteúdo totalmente novo: quebrando as barreiras entre profissionais e o público em geral, para que as ideias criativas de qualquer pessoa comum tenham a oportunidade de se tornarem parte da história olímpica centenária.
Como disse Kirsty Coventry, presidente do Comitê Olímpico Internacional: "Continuem criando, continuem compartilhando e façam com que suas ideias façam parte da história olímpica."
vídeo
O valor desta colaboração reside em fornecer um modelo de cenário replicável "de alta frequência e essencial".
Como mencionado no início, as pessoas comuns raramente sentem grande necessidade de gerar vídeos em seu dia a dia. No entanto, durante as Olimpíadas, a atenção global explode e os fãs demonstram grande paixão por se expressar, mas não dispõem de ferramentas práticas. Os métodos tradicionais de produção de conteúdo são caros ou apresentam altas barreiras de entrada, enquanto o conteúdo personalizado gerado por IA surge como uma opção mais adequada.

Além disso, os dados de comportamento do usuário também validam essa tendência. O Relatório de Pesquisa de Geração de Fãs 2025-2026 da WSC Sports mostra que a Geração Z e os Millennials não dependem mais de transmissões televisivas lineares, mas consomem vídeos curtos, compilações de melhores momentos e criações interativas de fãs nas redes sociais, com a fidelidade baseada na "relevância" em vez da "disponibilidade de conteúdo".
Isso significa que a lógica da disseminação de conteúdo está mudando: o público está deixando de ser o ponto final do consumo de conteúdo para se tornar a fonte de produção de conteúdo. As obras podem ser distribuídas livremente, sem restrições de direitos autorais. Você pode fazer de uma galinha Da Wan o personagem principal, ou pode fazer de um bolo de creme a pista de corrida.

▲Como participar da competição
Agora, basta visitar a seção "Conectar, Competir, Celebrar" no site oficial dos Jogos Olímpicos (olympics.com) ou acessar a página do evento diretamente pelo site da Alibaba Cloud. Escolha um movimento clássico da patinação artística, patinação de velocidade em pista curta, esqui alpino ou snowboard como modelo, insira uma frase com sua própria criatividade e você poderá criar sua própria obra de arte olímpica exclusiva.
O ecossistema de produtos de IA da Alibaba proporcionou amplo espaço para esta competição. Seja a comunidade de desenvolvedores de código aberto Modelscope ou ferramentas de criação de IA como Tongyi Wanxiang e Duiyou, todas participaram desta competição.
O que me surpreendeu ainda mais foi que os trabalhos de destaque deste concurso serão enviados ao Museu Olímpico para serem exibidos ao lado de artefatos olímpicos históricos, acrescentando uma nova nota de rodapé ao espírito olímpico centenário na era da IA.

Em vez de educar os usuários, uma vez que a criação tenha motivação e as obras tenham um destino definido, fornecer as ferramentas certas aos usuários aproxima os modelos de vídeo do seu momento de "pouso na Lua".
A inteligência artificial finalmente "abriu o código-fonte" dos Jogos Olímpicos, que já têm um século de existência; não somos mais apenas espectadores.
Olhando para trás, cada revolução na tecnologia da mídia remodelou a forma como interagimos com o mundo.
Se a fotografia nos deu o direito de registrar e a transmissão televisiva nos deu o direito de estar presentes, então a IA proporciona "acesso igualitário à imaginação".
Nas palavras da comunidade de IA, os Jogos Olímpicos se tornaram "de código aberto" pela primeira vez em um século.
A Competição Global da AIGC nos Jogos Olímpicos de Inverno de Milão foi essencialmente um "convite" para bilhões de pessoas em todo o mundo, transformando "assistir" em "criar". Não exigia mais habilidades físicas excepcionais ou destreza extraordinária. Bastava uma mente que se recusasse à mediocridade e um impulso para se expressar.

Esta é a primeira vez na história olímpica que a IA realmente devolve o "direito de participar" às pessoas comuns. Pela primeira vez , a imaginação e a criatividade alcançaram um status cultural equivalente ao das conquistas atléticas; pela primeira vez, as obras de pessoas comuns podem até mesmo superar as conquistas dos atletas em termos de reconhecimento e engajamento público.
Isso transmite um sinal muito sutil, mas preciso: a IA não deve ser apenas um brinquedo para nerds; ela deve pertencer a todos (IA para todos).
Quando a tecnologia estiver suficientemente avançada, deverá ser como água da torneira — basta abrir a torneira e usar. Não precisamos de idolatrar a tecnologia em si, mas sim usá-la para libertar a nossa criatividade.
Neste campo, não há árbitros, nem faltas, apenas a liberdade infinita da imaginação. Você pode transformar a Grande Muralha em uma pista de esqui, pode vestir os Guerreiros de Terracota com patins de gelo e pode deslizar pelo campo como Eileen Gu.
Portanto, o valor do Concurso Global AIGC dos Jogos Olímpicos de Inverno de Milão reside não apenas na quantidade de trabalhos produzidos ou no número de participantes, mas também no fato de ter validado uma hipótese de negócio que nunca havia sido validada antes com propriedades intelectuais de alto nível.
O valor das propriedades intelectuais (PIs) dos esportes tradicionais se baseia em três pilares: escassez (realizados apenas uma vez a cada quatro anos, com um número limitado de atletas de elite), imprevisibilidade (resultados de competição desconhecidos) e conexão emocional (honra nacional, idolatria). No entanto, na era da internet, todos os três pilares foram corroídos.
A inteligência artificial está agora prestes a se tornar o quarto pilar da propriedade intelectual esportiva.
Sua lógica central é transformar a propriedade intelectual, de um bem de consumo efêmero, destinado apenas à visualização e depois esquecido, em um "meio de produção" que pode ser usado para criação secundária. Em vez de gastar dinheiro para comprar tráfego, é melhor ceder os direitos criativos, transformando cada usuário em um canal gratuito que gera seus próprios recursos.
É provável que esse modelo se torne o padrão para todas as super IPs. Ele será replicado e iterado inúmeras vezes, disseminando-se de eventos esportivos a todos os cantos da cultura humana, até que eventualmente se torne o ingresso universal para que todos os grandes eventos abracem a era da IA.
Imagine o seguinte: fãs da Copa do Mundo poderiam gerar seu próprio momento glorioso de levantar o troféu com um único clique, espectadores da NBA poderiam se "colocar" na quadra para fazer a cesta da vitória, e isso poderia até se estender aos campos do entretenimento e da cultura — fãs de shows poderiam gerar vídeos de si mesmos no palco com seus ídolos, visitantes de museus poderiam "viajar" para cenas históricas e detentores do patrimônio cultural imaterial poderiam usar IA para demonstrar suas habilidades.
Esta pode ser uma nova interpretação do espírito olímpico na era da IA: não apenas mais rápido, mais alto, mais forte e mais unido, mas também "ousar pensar e ousar mostrar".
Autores: Li Chaofan, Mo Chongyu
#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

