Não entre em pânico, a pintura AI não pode matar a arte
Um dia de pintura AI é um ano na Terra.
Dall-E 2 e Midjourney, que se tornaram populares na primeira metade do ano, foram completamente ofuscados pela Stable Diffusion na segunda metade do ano.
Todos os produtos recentes de desenho a quente têm "difusão" em seus nomes e todos se beneficiam do algoritmo de "difusão" de inteligência artificial. Esse algoritmo rompe o ponto crítico do aplicativo de pintura AI, que é mais fácil de usar e tem melhor efeito.
A pintura de máquina tem uma história de meio século e, em dois anos, a pintura de IA de repente se tornou um "gigante atacante". Não apenas a qualidade melhorou visível a olho nu, mas a velocidade de geração de imagens também foi reduzida de alguns horas no início do ano para sino de mais de dez segundos.
Avanços significativos na tecnologia de pintura com IA despertaram o interesse pela "IA criativa" – uma variedade de ferramentas de IA que imitam a criatividade humana, desde artes plásticas até poesia. Mas ninguém realmente se sentiu em pânico.
Há algum tempo, muitos especularam que Yan Ning, um biólogo, deixou os Estados Unidos e voltou para a China porque o sistema de inteligência artificial AlphaFold poderia prever a estrutura das proteínas e foi roubado de seu cargo. Na verdade, o software que pode escrever informações de notícias existe há muito tempo e nenhum jornalista perdeu o emprego por causa disso. A IA não pode nem substituir as pessoas que escrevem cubos de tofu, muito menos os melhores cientistas.
O que é Algoritmo de Difusão
Os atuais modelos de inteligência artificial usam redes neurais de aprendizado profundo. Modelos de autoaprendizagem, como o GPT-3, é o mais famoso desses modelos, que "aprendem" na rede neural cerca de 45 TB de dados de texto e geram trabalhos quase iguais aos da produção humana.
A difusão estável faz parte da família de aprendizagem profunda. Especificamente, Stable Diffusion aprende a conexão entre imagens e texto por meio de um modelo de difusão latente. Funciona pegando dados de imagem e adicionando "ruído" a eles. Ruído, também chamado de ruído, refere-se aos pontos ásperos nas imagens captadas por equipamentos de fotografia digital, geralmente produzidos por interferência eletrônica.
Uma imagem é adicionada gradualmente com ruído até que toda a imagem se torne ruído branco. O modelo registra esse processo e o reverte para que a IA aprenda.
Do ponto de vista da IA, a primeira coisa que você vê é uma imagem cheia de ruído, depois a imagem fica mais clara e, finalmente, torna-se uma pintura. O que a IA aprende é todo o processo de redução de ruído, especialmente como lidar com o ruído gaussiano e, finalmente, gerar pinturas.
O ruído gaussiano refere-se a um tipo de ruído cuja função de densidade de probabilidade obedece à distribuição gaussiana (ou seja, distribuição normal). O algoritmo de difusão adiciona ruído gaussiano. Uma delas é verificar a validade da imagem "real", porque as imagens no ambiente de uso são todos ruidosos. Um é para a conveniência do aprendizado, desde que o ruído não esteja de acordo com a distribuição normal padrão, ele será inválido.
O banco de dados básico do Stable Diffusion é chamado LAION-Aesthetics, que contém imagens com ilustrações, e também é filtrado de acordo com o "estilo estético". Outros modelos de inteligência artificial treinados também "corrigiram" o banco de dados para prever como as pessoas responderiam às avaliações "quanto você gosta desta pintura" para eliminar algum conteúdo pornográfico.
Como é diferente dos "predecessores"
Stable Diffusion é semelhante a Dall-E 2 e Midjourney no sentido de que se baseia na "descrição de texto" para gerar imagens.
No entanto, o Stable Diffusion é de código aberto e seu código subjacente está disponível publicamente. Nem a Open AI nem o Google lançaram seus próprios modelos de IA.
A Stability AI é composta por mais de 4.000 GPUs NVIDIA A100 em execução na Amazon Cloud (AWS). Segundo relatos, os custos operacionais e de nuvem da Stability AI excedem US$ 50 milhões.
A empresa afirma que pode fornecer um "avanço em velocidade e qualidade" e que GPUs com menos de 10G de memória também podem ser executadas. Eles também fornecerão versões rodando em chips AMD e Apple M1/M2.
Atualmente, a função do Stable Diffusion é que ele pode converter texto em uma imagem de 512 × 512 pixels em poucos segundos; a imagem pode ser transformada, ampliada, modificada e substituída; usando modelagem GFP-GAN, permitindo que os usuários carreguem imagens faciais desfocadas para aumentar o zoom ou restaurar a aparência original.
No mês passado, a Stability AI levantou US$ 101 milhões. O CEO Emad Mostaque formou-se na Universidade de Oxford com mestrado em matemática e ciência da computação e trabalhou anteriormente como analista em vários fundos de hedge. Atualmente, a empresa está avaliada em US$ 1 bilhão. Além do Stable Diffusion, há também o Dance Diffusion – edição musical.
O plano lucrativo da Stability AI é treinar modelos "privados" e plataformas de infraestrutura de uso geral para clientes. Possui uma plataforma, DreamStudio, que também é acessível a usuários individuais. Hoje DreamStudio tem mais de 1,5 milhão de usuários que criaram cerca de 200 milhões de imagens. Contando todos os canais, Stable Diffusion tem mais de 10 milhões de usuários.
A empresa também fez uma contratação de alto nível do cientista e futurista do Google, Daniel Jeffries.
isso é arte?
Com o anúncio de várias inteligências artificiais, questões éticas e legais relacionadas também estão aumentando. A difusão estável permite a geração de imagens da vida real, e o problema se torna mais "sério".
A difusão estável tem sido usada pelos usuários para criar muito conteúdo sensível, e fotos falsas de celebridades estão voando por todo o lugar. A Getty Images proibiu uploads de imagens geradas pelo Stable Diffusion devido a questões de propriedade intelectual.
A deputada Anna G. Eshooo, da Câmara dos Representantes dos EUA, publicou recentemente uma carta instando o Conselheiro de Segurança Nacional dos EUA e o Escritório de Política Científica e Tecnológica a abordar esses "modelos inseguros".
No anúncio de lançamento, a Stability AI anunciou uma "licença avulsa que permite o uso comercial e não comercial", que na verdade é um acordo com os usuários. Ele espera que os usuários autorregulam seu comportamento e façam a "coisa certa" e tem pouco efeito em punir os usuários que não seguem as regras.
Além das questões legais, obras geradas por inteligência artificial também estão sujeitas à suspeita.
De qualquer forma, o Escritório de Direitos Autorais dos Estados Unidos considera essas imagens "não arte". Em fevereiro, o conselho de revisão do Copyright Office rejeitou reivindicações de imagens geradas por inteligência artificial.
O Conselho de Revisão enfatizou que "a autoria humana é um pré-requisito para a proteção dos direitos autorais" e requer "a relação entre o pensamento humano e a expressão criativa". O tribunal federal dos EUA também considerou em um julgamento recente que a inteligência artificial não pode ser considerada o "inventor" de uma patente.
A arte da inteligência artificial é muito atraente, embora não seja reconhecida legalmente, é reconhecida pelo mercado. Em 2018, a Christie's vendeu uma pintura de inteligência artificial por US$ 435.000. Além disso, a grande maioria dos consumidores não consegue diferenciar as pinturas de IA das obras de pintores humanos.
O mais polêmico é o concurso de arte da Colorado State Fair em setembro deste ano. O trabalho de inteligência artificial "Théâtre D'opéra Spatial" ganhou o primeiro prêmio. Foi produzido pela Midjourney e o operador Jason Allen disse "Art is dead, AI ganha, os humanos perdem".
Na verdade, não há necessidade de generalizar.Na criação da inteligência artificial, não há necessidade de ser excessivamente otimista ou exageradamente pessimista.
A criação artística de inteligência artificial é produzida de acordo com a "lógica" dos seres humanos.Naturalmente, não é tão boa quanto as elites humanas, mas é mais que suficiente para superar a mediocridade entre elas.
#Bem-vindo a prestar atenção à conta pública oficial do WeChat de Aifaner: Aifaner (ID do WeChat: ifanr), conteúdo mais interessante será apresentado a você o mais rápido possível.