Este modelo de vídeo inédito de uma empresa chinesa de IA que pode controlar caracteres com precisão em minutos está aqui |

julho 5, 2024 gurinho

O SenseTime fez algo ótimo novamente e pode gerar um vídeo de um minuto com apenas uma foto.

Em 4 de julho, o Vimi, o primeiro modelo de geração de vídeo de caracteres controláveis para usuários finais C criado pela SenseTime, foi selecionado como o "Tesouro do Hall", a maior homenagem para a exibição da Conferência Mundial de Inteligência Artificial (WAIC). exposição mais inovadora da conferência.

Baseado no novo modelo grande do SenseTime, o Vimi pode gerar um vídeo de personagem que seja consistente com a ação alvo através de apenas uma foto de qualquer estilo e suporta uma variedade de métodos de condução, que podem usar vídeos de personagens existentes, animações, sons, texto, etc. . Impulsionado por vários elementos.

Com o rápido desenvolvimento de grandes modelos e da tecnologia generativa de IA, não é mais difícil tornar as fotos "vivas".

No entanto, os produtos existentes no mercado ainda apresentam muitos problemas em aplicações práticas, como movimento impreciso e controle de expressão, baixa estabilidade de efeitos e duração limitada do vídeo, que limitam o espaço criativo dos criadores de vídeo.

Para superar esses gargalos, a SenseTime lançou um grande modelo de geração de vídeo de caracteres controláveis - Vimi.

Ao contrário da tecnologia de controle de expressão de imagem que só pode controlar os movimentos de expressão da cabeça, o Vimi pode não apenas obter um controle preciso da expressão dos personagens, mas também controlar as mudanças naturais do corpo dos personagens nas fotos na área de meio corpo e gerar automaticamente cabelos, cabelos e cabelos que combinam com as mudanças de figurino e cenário.

Ao mesmo tempo, o Vimi também pode gerar mudanças de luz e sombra de maneira razoável, tornando os movimentos dos personagens e efeitos visuais suaves e naturais, e a imagem harmoniosa e bonita.

Mais importante ainda, o Vimi pode gerar de forma estável vídeos de caracteres únicos de até 1 minuto, sem deterioração ou distorção ao longo do tempo, atendendo totalmente à demanda por vídeos estáveis de longo prazo em cenários de entretenimento e interação.

Ririxin declarou oficialmente que o Vimi estará totalmente aberto aos usuários C-end, especialmente para atender às necessidades de entretenimento e criação das usuárias.

Os usuários só precisam fazer upload de fotos em alta definição de pessoas de diferentes ângulos, e avatares digitais e vídeos fotográficos de diferentes estilos podem ser gerados automaticamente.

Os personagens de vídeo gerados pelo Vimi não são mais apenas movimentos faciais monótonos, mas são combinados com gestos, membros, cabelos, etc. para formar movimentos de personagens mais completos e unificados, permitindo aos criadores editar e recriar com base nos materiais de vídeo gerados.

Para usuários que gostam de tirar selfies, o Vimi oferece suporte a uma variedade de cenários interativos e de entretenimento, como conversar, cantar, dançar, etc.; para usuários que gostam de emoticons, o Vimi pode gerar uma variedade de emoticons de personagens interessantes por meio de uma única foto; com várias maneiras de brincar e alcançar a liberdade criativa.

Além disso, o Vimi também oferece uma variedade de estilos de geração, como estilo fotográfico estético e estilo fantasia, permitindo aos usuários viajar por diferentes dimensões e desfrutar de efeitos visuais imersivos semelhantes aos de um blockbuster.

Atualmente, 80% dos vídeos da indústria têm personagens como conteúdo principal. Ao mesmo tempo, com a explosão de vídeos curtos e plataformas de transmissão ao vivo, a demanda por vídeos com personagens como conteúdo principal aumentou exponencialmente.

No entanto, faltam no mercado produtos AIGC que possam controlar a geração de vídeos de personagens, o que leva a uma necessidade urgente de melhorar a eficiência dos criadores de conteúdo.

Pode-se dizer que o advento do Vimi apenas preencheu essa lacuna, fornecendo uma ferramenta de criação simples e fácil de usar para a maioria dos criadores de vídeos do lado C, que pode ser amplamente utilizada na criação de vídeos curtos de personagens.

Mais detalhes do Vimi serão revelados no fórum de inteligência artificial "Love Without Boundaries·Xiang Xinli", organizado pela SenseTime em 5 de julho. A APPSO também fará o acompanhamento com relatórios.

Atualmente, o Vimi abriu reservas no site oficial do SenseTime, e você está convidado a experimentá-lo.

Em anexo está o portal de endereços de reservas: https://vme-int.softsugar.com/questionnaire/

# Bem-vindo a seguir a conta pública oficial do WeChat de Aifaner: Aifaner (WeChat ID: ifanr). Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo |