Doubao suporta a geração de chinês em imagens! O problema dos gráficos vicentinos da IA finalmente foi resolvido
2024 está chegando ao fim e ainda é um problema em grande parte difícil para a IA gerar texto em imagens com precisão e fazer com que as fontes e os layouts tenham uma boa aparência.
Avaliamos anteriormente Ideograma e Recraft, que podem solucionar algumas das necessidades de geração de inglês. Depois de elogiá-lo, sempre tenho que acrescentar uma frase de arrependimento ao artigo – o chinês não é suportado. Os leitores chegam aqui entusiasmados e saem decepcionados.
Isso não tem culpa de que os radicais chineses no exterior sejam inerentemente mais difíceis do que as letras inglesas.
Somente com diamantes podemos assumir o trabalho em porcelana. A lacuna na geração de chinês é finalmente preenchida por um produto doméstico de imagem baseado em texto de IA: Byte Beanbao.
Crie uma imagem em 10 segundos, vamos falar ferramenta de emoticons chineses
A função de geração de chinês do Doubao está atualmente disponível no aplicativo. O método de uso é muito simples. Basta escrever o texto que deseja adicionar nas palavras da imagem de Vincent. Ainda não há suporte para adicionar texto à imagem de referência carregada.
Amigos que sofreram lavagem cerebral pelo jogo de simulação de negócios “Legend of Shawarma” devem ter gravado em suas mentes a frase “Vamos falar chinês” sem uma única palavra afinada.
Então também podemos replicar a vitrine do Hand Pancake King. A diferença é que desta vez você pode realmente falar chinês. A placa vermelha tem cinco grandes caracteres chineses e isso pode ser feito em cerca de 10 segundos.
Os pufes não são muito científicos e podem ser combinados com chinês e inglês. Nasceu de forma suave um logotipo de cafeteria que destaca o toque artesanal.
Uma ou duas linhas de palavras podem não explicar muito. A seguir, vamos aumentar a dificuldade. Deve haver mais palavras e o layout deve estar no lugar.
Inspirando-me no incidente do frango defumado em "Goodbye Lover 4", usei palavras rápidas para dar vários requisitos ao Beanbao.
A palavra-chave foi muito longa, mas Doubao entendeu, o preenchimento geral foi muito alto e a redação estava correta.
A geração de IA é incerta. Eu a gerei várias vezes, mas ainda estou muito satisfeito com esta. Embora a fonte não atenda totalmente aos requisitos, o frango defumado não é realista o suficiente e os caracteres pequenos estão distorcidos, o estilo de pintura é. agradável à vista, e o frango defumado é macio e macio.
Como diz o ditado, a vulgaridade extrema está na moda, e o pacote de emoticons para idosos é um exemplo, que inclui aproximadamente as seguintes características: texto atraente, elementos de boa sorte e efeitos especiais brilhantes.
Nós, que estamos acostumados com a abstração e a estranheza, também podemos aprender esse espírito de falar diretamente. Por exemplo, deixe Doubao se tornar uma “família amorosa”.
Gatos, peixes koi, rosas e pequenos brilhos, cercados por grandes personagens cheios de cores gradientes, têm uma nostalgia retrô terrosa. Não muito, talvez 40%.
O pufe da imagem Vincent tem um design muito prático – escolha o estilo. Não há necessidade de escrever palavras imediatas, com apenas um clique podemos controlar os estilos de filmes, desenhos animados, filmes, etc.
Usar um estilo especial e caracteres chineses gerados com precisão juntos obterá o dobro do resultado com metade do esforço. Combinado com o estilo pixel, podemos deixar Doubao desenhar uma história em quadrinhos de quatro quadros.
Minhas palavras de alerta são muito simples, e eu só preciso do conteúdo do texto e da imagem de cada grade. As imagens fornecidas por Doubao estão um pouco erradas, mas o texto é perfeito.
Alguns amigos podem estar se perguntando por que gerar texto em chinês é um requisito tão importante. Você não pode gerar a imagem primeiro e depois colocá-la no software P-picture para digitar o texto?
Claro que você pode fazer isso, mas deixe a IA gerar padrões e texto diretamente, e o estilo pode ser perfeitamente adaptado, sem qualquer sensação de gráficos P, e a jogabilidade é infinita, então por que não? No entanto, para eliminar caracteres pequenos distorcidos, você ainda precisa usar o software P-picture.
Ele pode ser usado em qualquer lugar e qualquer pessoa pode criar pôsteres e papéis de parede
Além da decoração, os pufes também podem ser transformados em designs úteis. Agora é possível gerar pôsteres, papéis de parede e cumprimentos de feriado com apenas um clique.
O que significa ser útil? Para mim, o plano de fundo do chat em grupo é uma necessidade para me lembrar de não dizer coisas inadequadas no lugar errado.
Então deixe a IA projetar um e peça que o texto seja colocado no sinal de alerta amarelo também deve receber esse espírito de trabalho.
Receio que os fogos de artifício do Ano Novo sejam muito altos, por isso quero dar-lhe as bênçãos do Ano Novo agora mesmo, incluindo nuvens e lingotes auspiciosos. Você também pode pedir à IA para ajudar a projetar capas de envelopes vermelhos para parentes e amigos no futuro.
"Wicked", estrelado pela Irmã A e adaptado do musical da Broadway, está sendo exibido na América do Norte e com lançamento previsto para a China. O que não corresponde à popularidade é o design simples do pôster.
Por que não deixar Doubao refazê-lo? Deduzi as palavras do autor da postagem original para explicar os elementos da imagem e depois deixei para Doubao.
Pelo menos Doubao fez um design de fonte para combinar melhor com o tema e a atmosfera de um filme de fantasia. O pôster original parece ter sido digitado com caracteres cursivos Word e PPT.
Além de musicais, pôsteres de estilo estético oriental e pufes também podem ser manipulados para apresentar uma caligrafia majestosa.
Escrever lindamente é uma coisa, mas o mais importante é que Doubao ouve as instruções das palavras imediatas. Qual estilo e cor do texto e onde colocar as palavras pode basicamente obedecer aos nossos desejos. Se isso não acontecer uma vez, gere-o mais algumas vezes.
Use pufes para desenhar a capa do Xiaohongshu. As fontes e cores acima e abaixo da imagem podem ser diferentes, tudo depende do efeito que queremos.
Os pufes também podem ser transformados em imagens realistas de produtos, e o texto é inclinado de acordo com o ângulo da embalagem, como se estivesse impresso na embalagem.
É claro que criar a capa do vídeo do Webmaster B não foi difícil para Doubao, que é profissional e acessível.
Portanto, a tecnologia existe, mas o mais importante é se a nossa imaginação é grande o suficiente e se a nossa estética é boa o suficiente.
O trabalho de design ainda não pode ser substituído pela IA, mas é melhor que cada um de nós tenha algum pensamento de design para que a IA possa apresentar melhor o que pensamos.
Para usar produtos de IA para resolver problemas, escolha produtos práticos e abrangentes.
Pode-se dizer que o primeiro produto nacional a incorporar a função de geração de caracteres chineses em um produto é o Beanbao da Byte. Pode-se dizer que não é surpresa.
Beanbao é um produto verdadeiramente realista e abrangente entre os grandes modelos nacionais. Cada vez que uma nova função é lançada, as pessoas sentem que é exatamente disso que eu preciso.
Escrita de IA, pesquisa de IA, resumo de documentos e páginas da web, Doubao certamente possui as funções padrão deste grande modelo.
▲ Use pufes para gerar uma interface de diálogo semelhante a um jogo de aventura em texto
Agente de IA, Doubao oferece aos usuários um grande número de opções, que podem não apenas satisfazer várias funções verticais, como GPTs, mas também conversar com você como um software complementar de IA.
Doubao possui todos os tipos de funções multimodais, como pesquisa de fotos, chamadas de voz, geração de imagens, geração de música, geração de vídeo.
▲ Use pufes para gerar um popular pacote de emoticons de animais de Xiaohongshu
Todas as nossas principais necessidades de IA são basicamente atendidas por Doubao. Ao mesmo tempo, Doubao também possui canais amplos, alcançando cobertura total em páginas móveis e da web, podemos conversar com Doubao a qualquer momento.
Vale ressaltar que esta semana a versão para PC do Doubao testará internamente a função de geração de vídeo. De acordo com nossa avaliação anterior, o modelo de geração de vídeo da Doubao é melhor para entender os usuários chineses e chineses do que produtos estrangeiros como Luma e Runway, e é mais adequado para o fluxo de trabalho criativo na Internet chinesa.
▲ Use pufes para gerar uma interface de barra de equipamento de jogo antiga. Parabéns por escolher um "bean bag". Os detalhes não são perfeitos, mas têm um sabor interno
O mesmo se aplica à geração de imagens. É bom que Ideograma e Recraft possam gerar caracteres ingleses, mas Doubao assumiu a liderança na solução do problema de geração de caracteres chineses, o que realmente resolveu os problemas dos usuários domésticos.
Ao contrário dos jovens pseudo-literários que gostam de dizer: “Você é tão especial, você me dá uma sensação de alienação”. Do nome ao logotipo, “Bean Bao” faz as pessoas se sentirem particularmente amigáveis, e esse calor também é trazido para o ambiente. design do produto, as funções do Doubao são muito fáceis de usar e são principalmente amigáveis para iniciantes.
O chinês é uma língua ampla e profunda e é um desafio para a IA gerar com precisão. Com tantas pessoas no mundo, todos podem usar a IA para projetar algo, independentemente do dispositivo que usam ou do idioma que falam. Todos os produtos de IA devem evoluir nessa direção, e Doubao foi o primeiro a fornecer respostas aos usuários chineses.
# Bem-vindo a seguir a conta pública oficial do WeChat de Aifaner: Aifaner (WeChat ID: ifanr). Mais conteúdo interessante será fornecido a você o mais rápido possível.