Depois de usar o artefato TikTok, desinstalei imediatamente o PS
As imagens se tornam texto, o que não é mais um problema hoje. Várias funções de OCR facilitam a extração de texto de imagens, e não é um grande problema para a IA interpretar uma imagem.
Mas desenhar uma imagem ainda é difícil para a IA de hoje. Reconhecer imagens e extrair informações é processar informações para a IA. Mas há uma camada extra no desenho, não apenas para processar as informações, mas também para completar a criação. A primeira é uma questão de múltipla escolha, enquanto a segunda é uma composição proposicional.
Logo depois de responder bem às questões de múltipla escolha, o próximo passo é responder às questões subjetivas do jogo livre. Mas ninguém pensou que o primeiro a responder a essa pergunta em seu próprio aplicativo foi o TikTok.
Use o TikTok para gerar o Facebook, Jack Ma
Comparado com gigantes como Google e OpenAI, que investiram muito na indústria de IA e estão imersos na indústria de IA há muito tempo, o TikTok pode ser apenas um "aluno transferido". Mas por que não é surpreendente que o estudante transferido tenha contornado o gigante e tenha feito o problema primeiro? Embora os alunos transferidos também tenham feito alguma ingenuidade, pelo menos eles ainda são muito impressionantes.
A função de texto para imagem feita pelo TikTok é chamada de "AI Greenscreen", que substitui o fundo branco monótono original, e a IA gera o fundo do vídeo para você. Os planos de fundo desses vídeos podem não atender às necessidades dos criadores, mas afinal, este é um plano de fundo de tela verde exclusivo e personalizado para você. Se você tiver sorte, pode ser mais adequado ao tema do conteúdo do vídeo.
▲ Clique no efeito especial para experimentar esta função ao enviar um vídeo. A imagem vem de Silicon Stars
Fizemos alguns testes com esse novo recurso para ver como fica a imagem desenhada pelo TikTok. Entre as palavras no teste aleatório, algumas pinturas eram desconcertantes, enquanto outras foram classificadas como "muito boas em retratar a estranheza".
O mais bem recebido é a pintura apresentada ao entrar no "Facebook". Você pode reconhecer vagamente o ícone azul do Facebook. O único olho e uma orelha na imagem criam uma sensação única de horror. Combinado com as notícias recentes do Facebook, devo dizer que esta pintura capta muito bem o sentimento da palavra Facebook.
Há também palavras como maçã e China que são retratadas com precisão na imagem. O primeiro pode ver facilmente que é uma maçã, e o segundo também pode ver edifícios de estilo chinês e, ao mesmo tempo, também evita a bandeira nacional e outros padrões sensíveis no campo do empreendedorismo. Só que é difícil apresentar uma imagem da Apple. Até as palavras-chave de Apple + Apple CEO Cook apresentam padrões relacionados a maçãs e pratos.
No entanto, também existem muitos outros não relacionados, por exemplo, tentamos Alibaba, Tencent e ByteDance, e não se pode dizer que os gerados não têm nada a ver com essas marcas. Mas em qualquer caso, é difícil reconhecer à primeira vista, um tanto abstrato.
Há também muitas imagens interessantes desenhadas inserindo os nomes dos personagens. O nome do famoso blogueiro artesanal estrangeiro Li Ziqi é uma pintura de paisagem agradável; a pintura do famoso ex-treinador da Premier League Wenger também é reconhecível à primeira vista, que pertence ao estilo de re-desconstrução de fotos clássicas ; O estilo de Jack Ma também é um pouco estranho , e os olhos que são consistentes com o Facebook têm uma sensação de espiar.
Quanto a Musk, geramos quatro imagens com o TikTok e nenhuma delas era reconhecível.
É claro que, além do sucesso das palavras dos personagens e imagens abstratas, também existem Switch e Guangzhou que são considerados expressos da maneira certa e podem ser uma reminiscência.
Uma pintura ao estilo Zelda com personagens que fazem os fãs reconhecerem "este poderia ser o Mario". Da mesma forma, os edifícios icônicos e cores brilhantes de Guangzhou podem ser facilmente identificados.
O tempo para gerar cada imagem de fundo é inferior a 5 segundos. Se o tema for semelhante, essas imagens são muito adequadas para a imagem de fundo do vídeo. O tempo de geração é curto e todos estão disponíveis.Essas são as vantagens do TikTok, portanto, a aparência de um produto de texto para imagem em um aplicativo com centenas de milhões de atividades diárias pode ser considerada um evento marcante.
É que o TikTok ainda usa atalhos.
Atualmente, quase todos os quadros produzidos pertencem ao estilo da pintura, e muitos até ao abstracionismo e impressionismo.Comparado com a geração de imagens realistas, essa dificuldade é muito menor. Afinal, mesmo que você não se pareça com você, pode confiar no seu cérebro para compensar isso. A IA que entende as palavras que você digita é o mesmo problema que você enfrenta quando vai a um museu de arte para ver uma exposição de arte – se a semelhança não for suficiente, então entenda e invente.
Este também é um método de economia de custos.A dificuldade é menor, o poder de computação necessário também é menor e o custo é menor.
▲ Mesmo fotos com um pouco de texto sangrento não serão muito assustadoras
Texto para imagem, mesmo o Google não tem produto gerado em tempo real
Do ponto de vista do efeito, o efeito de renderização de tela verde da IA do TikTok não pode ser muito alto. Mas como uma tecnologia com um limite alto, pode ser considerada uma melhoria se puder ser usada por usuários sem nenhum limite em poucos segundos.
Embora limitado pelo fato de que as imagens geradas não são "cotidiano" o suficiente, e não são realistas o suficiente para causar preocupações sobre abuso de tecnologia e fraude de imagem, imagens realistas podem realmente ser feitas, mas não na medida em que todos possam usar telas verdes de IA. É isso.
O Google também lançou uma ferramenta Imagen AI que pode transformar uma simples frase em uma imagem real – tão real quanto uma sessão de fotos. Mas, infelizmente, mesmo o Google, que investiu pesadamente em IA, não conseguiu fazer produtos gerados na hora. Em outras palavras, a opção de pedir que uma IA faça um desenho para você ainda não está disponível no Imagen AI.
▲ Imagen AI pode clicar em diferentes opções para fazer fotos diferentes
Atualmente, existem apenas algumas opções predefinidas no site oficial. Mesmo se você clicar em cada uma, existem apenas dezenas de combinações, mas há estilos realistas e estilos de pintura a óleo para escolher. Os leitores interessados ainda podem ir jogar um pouco sozinhos.
O Google é do tipo que fica famoso e chama a atenção a cada movimento. E o laboratório de pesquisa de inteligência artificial OpenAI conta com trabalhos, e eles lançaram o gerador de texto para imagem de inteligência artificial mais original e popular Dall-E.
▲ Dall-E
Dall-E pode reeditar realisticamente imagens existentes a partir de conteúdo de texto, pode adicionar e remover elementos para você, levando em consideração a renderização de sombras, reflexos e texturas – a tecnologia PS pode matá-lo. É muito simples analisar e imitar as pinturas existentes e substituí-las.O estilo de inspiração vem da obra original, ou seja, o protagonista é alterado.
Como um projeto de pesquisa, Dall-E ainda está em beta fechado, e um "número limitado de usuários confiáveis" na lista tem postado foto após foto nas mídias sociais. Cada usuário que participa do teste pode ganhar 50 pontos grátis inicialmente, e depois 15 pontos por mês depois disso, 1 ponto pode gerar 4 fotos com um conteúdo de texto, e também pode escolher três estilos de pintura.
Atualmente, Dall-E ainda tem muito poucos métodos de monetização para usuários beta internos – se você quiser experimentar o serviço depois que os 15 pontos por mês se esgotarem, poderá comprar 115 pontos por US $ 15. A boa notícia é que as imagens resultantes também podem ser comercializadas e, depois de criá-las através do Dall-E, você pode usá-las para tudo, desde ilustrações, capas, designs de camisetas e muito mais.
▲ O usuário pode adicionar elementos na posição definida, e os elementos adicionados à foto também serão complementados automaticamente em termos de sombras, etc.
A diretora de vídeo Karen X. Cheng disse à Bloomberg:
Estou tentando gerar imagens por horas a fio e me perdi… parece mais que você está trabalhando com uma pessoa viva do que com uma ferramenta como o Photoshop.
Claro, Dall-E não é perfeito no momento. Ainda é um pouco difícil para ele criar um rosto humano completamente realista. Requer conhecimento médico profissional para poder apresentar com precisão os ossos humanos. Não é muito bom. O pesquisador Aditya Ramesh disse que o DALL-E só sabe ler texto e gerar imagens, então está tentando criar algo visualmente semelhante.
▲Fotos fantásticas geradas por Dall-E
Essa tecnologia é, obviamente, muito promissora. Você pode imaginar que ela reduz o limite para os criadores de conteúdo encontrarem fotos, e você pode imaginar que os retratistas podem melhorar a eficiência com sua ajuda. Mas, assim como toda tecnologia pode ser abusada, a tecnologia de IA para ajudar o texto a gerar imagens também tem esse risco – os cenários negativos de aplicativos que apareceram no Deepfake serão repetidos um a um.
Felizmente, desta vez o provedor de tecnologia já se preparou com antecedência para colocar a IA em uma gaiola.
As imagens abstratas do TikTok são em si uma camada de proteção porque não são realistas. Além disso, mesmo que você insira algum conteúdo sugestivo (violência, nudez) no TikTok, as pinturas apresentadas ainda não são as esperadas, e o estilo abstrato não é claro e evita o enorme custo de revisão.
▲ Restrições no site oficial de Dall-E
Dall-E também limita a geração de conteúdo violento, adulto e odioso pela IA, minimizando a exposição de Dall-E a tais conceitos no algoritmo. Ao mesmo tempo, a plataforma também possui tecnologia avançada para evitar o uso de rostos humanos reais para gerar imagens (celebridades são aliviadas), e sistemas de monitoramento automatizados e humanos também evitam o abuso de Dall-E.
É só que o surgimento de todas as novas tecnologias não pode apenas olhar para o lado ruim, e as perspectivas de alta eficiência que ele traz valem a pena esperar. Pelo menos, Ai Faner está ansioso pelo final do artigo que será publicado um dia: "O mapa do título do artigo é gerado por Dall-E".
#Bem-vindo a prestar atenção à conta oficial do WeChat de Aifaner: Aifaner (WeChat: ifanr), mais conteúdo interessante será trazido para você o mais rápido possível.