“Black Myth Wukong” modificado magicamente para derrotar Midjourney. Esta ferramenta de desenho de IA é incrível.
Quando os Ideogramas de IA competem por realismo e arte, o Ideograma abre um caminho complicado: ele pode gerar texto em imagens com precisão, e as fontes e layouts são lindos.
Essa demanda não é um nicho. A geração de pôsteres e ilustrações com um clique, sem a necessidade de imagens P, pode evitar muitos problemas e é muito adequada para pessoas comuns que nada sabem sobre design.
Escrevemos anteriormente sobre a versão 1.0 do Ideogram . No dia 21 de agosto chegou a versão 2.0 O realismo está melhor, os pôsteres estão mais desenhados e a habilidade especial do texto também está mais forte.
Você pode nunca ter ouvido falar dele. Este é um produto de IA desenvolvido por ex-funcionários do Google. Ele tem muitas deficiências, mas o longboard pode “ultrapassar” o Midjourney nas curvas.
guiar o caminho https://ideograma.ai/
AI quer saber de qual Wukong você está falando?
O Ideograma tem um recurso particularmente amigável para iniciantes: “Dicas mágicas”.
Você insere diretamente a palavra de prompt em chinês e isso o ajudará a traduzi-la para o inglês e a otimizá-la ao mesmo tempo. Por ser um produto estrangeiro, esse tipo de operação pode conquistar o coração das pessoas.
Ao mesmo tempo, o Ideogram concentra-se em cinco estilos: comum, realista, design, 3D e animação. Todos são fáceis de entender, portanto a escolha não será confusa.
Deixe-me começar com uma simples palavra chinesa, "Sun Wukong segurando um porrete de ouro", estilo anime, deixe a IA me ajudar a traduzi-la e otimizá-la e ver como ela pode ser usada livremente.
Quando a versão "Dragon Ball" de Wukong de Shui Lingling foi lançada, fiquei chocado. Quando olhei para as instruções, a IA traduziu Sun Wukong em "Son Goku", então não é surpreendente.
Além disso, também quero perguntar ao Ideograma se é muito flagrante pagar royalties.
Para evitar mais mal-entendidos por parte da IA, parei de ser preguiçoso ao inserir a palavra de prompt e enfatizei que “Sun Wukong” é “Sun Wukong”, não “Son Goku”.
Desta vez, adotamos um estilo realista e especificamos uma cena mais detalhada. O grande sábio está vestindo uma armadura e segurando um aro dourado na mão. Sua expressão é solene e majestosa. tom, a parte inferior da imagem diz "Black Myth: Wukong" (Black Myth: Wukong).
Não há erros no texto, as letras maiúsculas têm um forte impacto e a atmosfera da caverna budista também é criada. Porém, o temperamento do “Grande Sábio” é um pouco estranho, a imagem é um pouco atávica e. não há luz em seus olhos.
Use as mesmas palavras de prompt para gerar Midjourney uma vez. O texto está errado e não tem senso de design, mas o "Monkey King" um pouco mais bonito e o estilo do jogo na web compensam isso.
▲ Meio da jornada gerado
Não querendo me reconciliar, tentei o estilo 3D novamente. A palavra de aviso permaneceu basicamente a mesma, mas o texto na parte inferior foi alterado para “Lançamento do jogo em 20 de agosto”.
Como resultado, o resultado gerado pelo Ideogram é muito semelhante à imagem promocional de uma certa série de blind box da versão Q no estilo chinês. A imagem é muito limpa, mas não é de forma alguma o estilo de jogo 3D em minha mente. Monkey King também é desenhado para se parecer com Erlang Shen.
E a IA também se expôs. Embora fosse muito boa na renderização de texto em inglês, ela não sabia nada sobre o chinês. Essa falha continuou de 1,0 a 2,0.
Parece que os produtos estrangeiros não entendem suficientemente a cultura tradicional nacional. O desempenho do Ideograma na primeira rodada foi um pouco decepcionante, mas também foi interessante.
A equipe do Ideogram disse que a versão 2.0 é tão boa quanto Flux e DallE. Recentemente, as fotos do discurso TED geradas pela versão real do LoRA do Flux enganaram muitos internautas porque é difícil distinguir se são genuínas ou falsas. Então vamos testar o quanto os resultados gerados pelo Ideograma se parecem com fotos.
▲ Geração de fluxo
Depois de escolher o estilo realista, digitei as palavras chinesas, as fotos do TED Talk e o título do slide era "Lançamento do Ideograma 2.0. Havia três pontos principais: "texto preciso", "bom em design" e "mais real". ". A palestrante ficou em frente ao quadro branco, há algumas pessoas ao fundo.
Percebe-se que a compreensão semântica do Ideograma é boa e possui todos os elementos necessários. O logotipo do TED é quase falso, as expressões do palestrante e do público são muito vivas e o cabelo e a pele são relativamente naturais.
No entanto, os detalhes não são bem tratados. Embora não haja nenhum problema com o texto que precisa ser gerado, algumas pequenas palavras que aparecem aleatoriamente estragam o pote, e os dedos e corpos dos personagens não estão certos, mas estão. já muito melhor que a versão 1.0 anterior.
Quanto ao design do cartaz, pode-se dizer que o Ideograma está na “zona de conforto” de outras IAs Vicentinas.
Se o sucesso de bilheteria “Alien” for usado como pergunta do teste, a IA pode criar esse sentimento indescritível de terror?
Escolhi um estilo de design, usei palavras rápidas para descrever os elementos da imagem e mencionei especificamente uma frase na parte inferior do pôster: “Os espectadores menores de idade assistem com cautela”.
O efeito geral é atraente e uma longa sequência de texto foi gerada com sucesso. Há apenas um pequeno erro, mas não é realista e parece mais um estilo de história em quadrinhos, que não combina com o filme de ação ao vivo.
Usei então o péssimo filme de verão "A Dream of Red Mansions" como inspiração e pedi ao Ideogram para gerar um pôster. O fundo, as decorações e até os personagens mencionados nas palavras imediatas foram todos incluídos nele. as palavras imediatas são realmente boas.
É claro que o título do filme está escrito corretamente, mas a fonte parece ter sido emprestada de O Senhor dos Anéis, é um pouco dramática e o estilo geral é mais parecido com o filme de animação Mulan.
O “estilo de design” do ideograma é mais bidimensional e único, mas, por outro lado, isso também limita os cenários de uso dos pôsteres.
Para resumir, Ideogram é um produto gráfico de IA único. Seu nível de realismo é semelhante ao Flux e seu sentido artístico é diferente do Midjourney.
▲ padrão "verão chuvoso"
Porém, possui um nível único de geração de texto e é mais adequado para geração de pôsteres, ilustrações, anúncios, emoticons, impressão de camisetas, etc.
Os resultados da avaliação humana mostram que o Ideogram 2.0 é melhor que o Flux Pro e o DALL·E 3 em termos de alinhamento rápido de palavras, desempenho geral e qualidade de renderização de texto.
▲ Mas esta é a declaração do próprio Ideograma
Altamente jogável e prático, você também pode ter mais “sobremesas” de IA como esta
O Ideograma foi anunciado em 22 de agosto do ano passado, exatamente um ano após o lançamento do 2.0.
A equipe fundadora tem um total de 7 pessoas do Google Brain, Universidade da Califórnia, Berkeley, Universidade Carnegie Mellon e Universidade de Toronto, 4 dos quais são os autores do artigo de pesquisa Imagen do modelo de difusão de gráficos do Google Vincent.
Além de lançar o 2.0 desta vez, o Ideogram também lançou um aplicativo iOS, que pode ser baixado diretamente na China. A versão Android está prevista para ser lançada posteriormente. Das páginas da web aos terminais móveis, podemos gerar imagens a qualquer hora e em qualquer lugar.
▲Interface móvel
O Ideogram está atualmente aberto a todos os usuários gratuitamente, mas a cota é muito limitada. Depois de gerar um total de 20 fotos 5 vezes, o Ideogram me lembrou que 10 pontos foram usados, por favor volte amanhã. (É claro que o Midjourney ao lado gera 25 fotos de graça, o que não parece muito impressionante.)
Se você raramente entra em contato com diagramas Vicentinos e deseja começar com um diagrama Vicentino AI, o Ideograma é uma boa escolha.
Inserir palavras de prompt em chinês, usar "prompts mágicos" para traduzir e otimizar é uma coisa. Além disso, o Ideogram também tem muitas opções para ajudá-lo a gerar imagens mais próximas do que você deseja.
Fornecer uma gama limitada de opções para os usuários “clicarem” torna a interação mais fácil do que preencher uma “entrada” em uma caixa de entrada em branco. Seja qual for a proporção, estilo e tom da imagem que você deseja, o Ideograma permite que você escolha.
▲ “Menina com Brinco de Pérola Comendo McDonald's” em cores diferentes
Se você não sabe escrever palavras rápidas, você também pode desenhá-las e deixar o Ideograma nos ajudar a transformar o mundano em magia.
Sinto muito por minhas fracas habilidades de desenho, mas a IA entendeu o significado, otimizou as linhas e cores e adicionou um fundo, e o estilo melhorou repentinamente. Com IA, quem não é a caneta mágica Ma Liang?
Além disso, na caixa de entrada da versão web, existem trabalhos gerados por terceiros. Quando encontramos aqueles que gostamos, podemos visualizar e consultar as palavras de alerta. A Ideogram afirma que seus usuários geraram mais de 1 bilhão de imagens visíveis publicamente no ano passado.
Se você deseja gerar um objeto específico, mas não sabe escrever a palavra prompt, o Ideogram também lançou a função de pesquisar na biblioteca pública de criação com texto, mas atualmente essa função requer adesão.
▲ Resultados da pesquisa para "gato"
Resumindo, Ideogram é um produto jogável de Vincent.
Ele pode gerar com mais precisão o conteúdo de texto exigido pelos usuários e se adaptar a vários estilos de imagens. Possui uma ampla gama de áreas de trabalho.
▲ Blog de ideogramas
Ocasionalmente, pode trazer valor emocional e expressar ambição através de imagens, embora os emoticons produzidos sejam demasiado tendenciosos para a estética da Internet europeia e americana.
▲ Pacote de emoticons "Eu quero jogar" Black Myth: Wukong ""
A qualidade geral do Ideograma não é ruim, a função de texto é poderosa, amigável para iniciantes, fácil de usar e as interações são agradáveis. Quando as ferramentas de IA combinam criatividade, conveniência e compartilhamento de valor, é fácil para as pessoas ficarem fisgadas.
Um mundo esculpido em moldes é muito chato. Também é muito interessante discernir uma pequena necessidade e depois tornar a solução a primeira do setor.
Existem muitos produtos no mundo e, com mais público, podemos esperar mais “sobremesas” de IA.
# Bem-vindo a seguir a conta pública oficial do WeChat do aifaner: aifaner (WeChat ID: ifanr). Mais conteúdo interessante será fornecido a você o mais rápido possível.