Sem parar na “Grand Graphics Card”, a NVIDIA lançou o modelo Perfusion “Vincent graph” para aprender novas tecnologias

As placas gráficas NVIDIA são vendidas tanto que é quase esquecido que também é um gigante de IA generativa.

Recentemente, o último artigo publicado da NVIDIA divulgou uma tecnologia de aprendizagem personalizada chamada modelo "Vincent graph" da Perfusion.

De acordo com o site oficial, a tecnologia Perfusion foi desenvolvida em conjunto pela NVIDIA e pela Universidade de Tel Aviv, em Israel. A tecnologia de perfusão permite a liberdade de criar objetos mais personalizados, obter resultados mais vívidos, ter melhor correspondência de sugestões e ser menos suscetível às características de fundo da imagem original.

Aaron Lefohn, vice-presidente de pesquisa gráfica da NVIDIA, certa vez descreveu a tecnologia Perfusion como "uma tecnologia altamente compacta… que permite aos usuários combinar vários elementos personalizados, como ursinhos de pelúcia e bules específicos, em um único visual gerado por IA".

Entre eles, a NVIDIA usa um novo mecanismo chamado "key lock".

A explicação popular é que ele divide o mecanismo de atenção no modelo de geração de imagem em duas partes: a parte de localização e a parte de conteúdo. A parte de posição determina qual objeto desenhar e a parte de conteúdo determina o estilo de aparência do objeto.

O "mecanismo de chave" corrige a parte de posição e evita que o objeto mude arbitrariamente. Por exemplo, a posição de um ursinho de pelúcia específico é consistente com todos os ursinhos de pelúcia modificados. Ao mesmo tempo, a parte do conteúdo permite que a aparência do objeto mude livremente, como mudar a roupa do ursinho de pelúcia do nada.

Além disso, a tecnologia de perfusão pode optar por controlar o grau de alteração do objeto no processo do diagrama de Vincent, que pode ser mais parecido com o objeto original ou mais alinhado com a descrição do usuário. Vários objetos gerados por registros históricos também podem ser combinados em uma mesma imagem.

Graças à natureza avançada do mecanismo "key lock", o funcionário afirma que a qualidade da imagem gerada pela tecnologia Perfusion é comparável à da versão Stability Diffusion v1.5.

Porém, a tecnologia Perfusion é mais personalizada, com capacidade de aprender rapidamente a lidar com novos conceitos sem retreinar todo o modelo, o que não está disponível na Stability Diffusion.

Além disso, a tecnologia Perfusion oferece maior controle, que pode equilibrar facilmente a qualidade visual e o controle semântico e pode combinar vários novos conceitos (como fazer com que o modelo gere um ursinho de pelúcia específico e um bule de chá específico ao mesmo tempo).

Em geral, a tecnologia de perfusão inova principalmente no aprendizado e controle personalizados, tornando a geração do sistema de diagrama de Vincent mais fácil de personalizar.

O que muitas pessoas podem não saber é que a discreta NVIDIA realmente fez muitas conquistas no campo da IA ​​generativa e fez contribuições pioneiras para várias tarefas generativas, como super-resolução de imagem e estimativa de profundidade.

Em maio deste ano, o fundador da NVIDIA, Jensen Huang, previu corajosamente: “A indústria de computadores está passando por duas transformações simultâneas – computação acelerada e inteligência artificial generativa”. a infraestrutura será atualizada para computação acelerada para produtos, serviços e processos de negócios”.

A IA generativa treina redes neurais em larga escala, exigindo poder de computação altamente complexo. A GPU é mais versátil, mais adequada para computação paralela em grande escala, e o processo de design e fabricação é relativamente maduro. Essa é precisamente a zona de conforto para a NVIDIA dominar o "portão da vida" dos grandes modelos de IA.

Em termos de participação de mercado, a NVIDIA detém 84% do mercado de GPU. De acordo com os dados divulgados pela TrendForce, uma agência de pesquisa de mercado, se o poder de processamento da placa de vídeo NVIDIA A100 for usado, serão necessárias 30.000 GPUs NVIDIA para rodar o ChatGPT, o que significa que a NVIDIA poderá faturar mais de 300 milhões de dólares americanos. .

No entanto, a NVIDIA exclusiva não está apenas satisfeita com o "vendedor de ouro e água", mas liberou totalmente o "talento inato" de seus próprios recursos no campo do desenvolvimento de tecnologia de modelo generativo.

Em 2018, os pesquisadores da NVIDIA assumiram a liderança ao propor a rede de confrontação generativa StyleGAN, que é o primeiro modelo GAN que pode gerar imagens faciais de alta qualidade. Um ano depois, a NVIDIA lançou oficialmente o primeiro modelo GAN que pode diretamente Modelos que geram imagens realistas .

Existem muitos "primeiros" semelhantes. Hoje, a tecnologia Perfusion é um dos resultados da mais recente IA generativa da NVIDIA.

O lançamento da tecnologia Perfusion, por um lado, pode continuar a demonstrar as capacidades técnicas da NVIDIA no campo de IA generativa e estabelecer totalmente a liderança e influência da NVIDIA no campo de IA generativa Integração futura em produtos e serviços da NVIDIA.

Vale a pena notar que a NVIDIA só publicou artigos relevantes no site oficial no momento, e demonstrações específicas de código serão lançadas em breve.Até então, os usuários terão opções mais diversificadas para os requisitos funcionais dos gráficos de Vincent.

#Bem-vindo a seguir a conta pública oficial do WeChat de Aifaner: Aifaner (ID do WeChat: ifanr), conteúdo mais interessante será apresentado a você o mais rápido possível.

Ai Faner | Link Original · Ver comentários · Sina Weibo