A ferramenta de edição de fotos com um clique do Doubao é uma salvação para iniciantes em fotografia. Em anexo, seguem as instruções de edição.
A pós-produção de fotos sempre foi um obstáculo entre pessoas comuns e filmes de "sucesso de bilheteria".
Os profissionais gastam muito tempo e energia nisso, passando horas em frente à tela do computador depois de fotografar, lutando com várias curvas e camadas; os entusiastas comuns geralmente ficam intimidados pelas ferramentas incompreensíveis do Photoshop e do Lightroom.
Todos nós parecemos presumir que uma ótima foto requer excelentes técnicas de pós-produção.
No entanto, a "edição de fotos doubao" que estava na lista de pesquisas há alguns dias chamou minha atenção.
Com a IA tão popular agora, a edição de fotos pode se tornar incrivelmente fácil: você só precisa explicar sua ideia em uma frase, e a IA pode ajudá-lo a criar uma foto que você goste.
Para a IA, o assunto não é mais um problema difícil
Como uma arte antiga, a fotografia foi dividida em muitas escolas, incluindo retratos, paisagens, comidas, etc.
No passado, cada arte marcial tinha suas próprias técnicas secretas para estágios posteriores, mas agora, a IA é como um mestre de artes marciais que abriu os meridianos de todas as escolas de artes marciais, usando um conjunto de algoritmos poderosos para abordar todos os tipos de assuntos.
Fotógrafos de paisagens geralmente trabalham do amanhecer ao anoitecer esperando pelo clima e pela luz perfeitos.
Mas se você não tiver sorte e tirar uma foto com um céu claro, será bem trabalhoso processá-la depois: você precisará criar uma máscara complexa, separar o céu e o chão e ajustá-los separadamente.
Mas com a IA, fica tão fácil quanto pedir comida para viagem.
Processei uma foto usando Photoshop e Doubao, respectivamente. A foto foi tirada antes do anoitecer, mas as nuvens pesadas bloquearam o pôr do sol espetacular e também reduziram bastante o brilho da imagem, deixando-a escura.
O objetivo da edição de fotos é substituir o céu que não estava bonito o suficiente. Você consegue dizer rapidamente qual foi editado por IA e qual foi editado manualmente?
A resposta foi revelada: a da esquerda é o resultado do meu processamento manual usando o Photoshop em menos de cinco minutos, e a da direita é a versão gerada pelo Doubao em dezenas de segundos.
À primeira vista, os efeitos dos dois são semelhantes, mas, como alguém que operou pessoalmente ambas as versões, a diferença é óbvia.
De acordo com o processo tradicional de edição de fotos, preciso recortar o céu manualmente e com cuidado, mantendo os detalhes dos galhos no chão; depois, encontrar materiais adequados para o pôr do sol para substituir as nuvens espessas originais e unificar o tom de cor e o brilho do céu e do chão para garantir a harmonia de cores de toda a imagem.
No Doubao, preciso apenas de uma frase para gerar uma imagem com grau de conclusão quase alto.
▲ A operação originalmente complicada pode ser feita com apenas uma frase pela IA
Após ampliar para visualizar os detalhes, embora a qualidade da imagem da IA seja ligeiramente inferior à da versão processada manualmente em ampliação extrema, Doubao ainda retém os detalhes da junção da floresta com o céu, e o brilho e a temperatura da cor do solo também são otimizados simultaneamente. A imagem geral é harmoniosa e natural, demonstrando uma lógica de edição de fotos bastante madura.
▲ A fronteira entre o céu e a terra processada por Doubao é mais delicada do que aquela que processei em dois minutos.
Outro desafio ao tirar fotos de paisagens do dia a dia é o grande número de transeuntes.
Tradicionalmente, você primeiro importaria a foto para o Photoshop, usaria a ferramenta Pincel de Recuperação Local ou Carimbo e aumentaria o zoom em 300% para um processamento detalhado.
Ao pintar transeuntes, você precisa decidir se usa reconhecimento de conteúdo ou correspondência míope. Se encontrar texturas complexas, terá que criá-las manualmente, o que é extremamente tedioso.
▲ Dominar essas ferramentas é o primeiro passo na pós-produção tradicional
Mas para a IA, isso é apenas uma questão de minutos——
Depois de esperar menos de um minuto, recebi a foto processada: ela não apenas manteve o tom e a qualidade da imagem original, mas também removeu com precisão todos os transeuntes.
O que é particularmente louvável é que, ao remover os caracteres, a IA também preserva meticulosamente os detalhes das sombras das rochas na margem direita do rio, sem as marcas de borrões comuns. O efeito geral é muito satisfatório.
▲ Use o ChatGPT para remover transeuntes
Reenquadramento é uma técnica avançada de retoque em fotografia de paisagem. Nela, o fotógrafo aplica ferramentas como máscaras e pincéis para refinar detalhes da imagem durante o pós-processamento, adaptando a aparência da imagem. Seguindo uma abordagem intuitiva e lógica, o fotógrafo reconstrói o efeito geral de iluminação, criando contrastes entre claro e escuro, destacando o objeto, criando uma atmosfera e aprimorando o impacto visual da imagem.
parar!
Sei que depois de ouvir tudo isso, você deve estar confuso. Resumindo, remodelar significa ajustar fotos para que sejam mais impactantes e lógicas, com base na estética e nas técnicas pessoais.
No passado, para conseguir isso, não era preciso apenas ser proficiente em diversas ferramentas do Photoshop, mas também ter um certo entendimento e controle de luz, além de excelente estética, para criar efeitos de luz e sombra que não fossem exagerados nem perfeitos.
▲Acredite em mim, você não quer aprender esse processo
Agora, entregá-lo à IA é apenas uma questão de uma frase——
Após uma breve troca, a IA processou a foto usando os mesmos princípios da fotografia de paisagem, adicionando uma névoa stratus para obscurecer detalhes inúteis, cobrindo os edifícios mais baixos e criando uma atmosfera nebulosa.
Ao mesmo tempo, a luz e a sombra são remodeladas. Partindo da lógica original de luz e sombra da pintura, o efeito de reflexão da luz solar na superfície do edifício é realçado, tornando a luz e a sombra da pintura razoáveis e em camadas, destacando a subjetividade da Torre Pérola Oriental.
▲ Usando ChatGPT para reconstrução de luz e sombra
Também podemos aplicar o mesmo método a outra categoria importante do álbum que não pode ser ignorada: animais de estimação e retratos.
Isso não se refere a ajustes subjetivos, como suavização da pele e remodelação facial, que variam de pessoa para pessoa, mas sim que a IA pode ajudar a polir a luz e a sombra da imagem de acordo com uma certa lógica, criando uma atmosfera especial para obter uma textura que não pode ser emitida diretamente por um telefone celular.
Além de ajustar a luz, usar IA para adicionar adereços e criar uma atmosfera especial nesse tipo de foto é outra maneira de brincar.
Assim como o comando anterior para alterar o céu, você pode usar um comando para deixar a IA adicionar alguns elementos que combinem com o ambiente da imagem, como folhas amarelas flutuando no céu ou a luz do sol entrando pelo parapeito da janela.
Abra um pouco mais a sua mente. Se o clima estiver ruim, você pode deixar a IA alterar o céu e prestar atenção à iluminação dos personagens para obter uma foto harmoniosa.
▲ Cena de neve também é uma boa escolha
Agora que o cenário, os personagens e os animais de estimação foram cuidados, há outro assunto importante que não pode ser esquecido: a comida.
Tradicionalmente, os fotógrafos precisavam calibrar precisamente o balanço de branco para evitar qualquer distorção de cor que fizesse a comida parecer pouco fresca.
Na pós-produção, você precisa ter cuidado para aumentar a clareza, mas não em excesso, caso contrário, a comida ficará seca e pouco apetitosa. Em seguida, você precisa usar a curva de tom e os controles deslizantes HSL (matiz, saturação, luminosidade) para ajustar com precisão o desempenho de cada cor e torná-la mais atraente.
Aqui também a IA pode ser de grande ajuda.
As fotos retocadas apresentam camadas mais nítidas: o coelho e o frango frios são cobertos com um molho vermelho vivo e oleoso, a superfície é coberta com gomos de pimentão vermelho fresco e os amendoins dourados espalhados entre eles são crocantes e tentadores. O impacto visual e gustativo é avassalador, despertando o apetite instantaneamente.
Pode-se dizer que, com a ajuda da IA, você ultrapassou o alto muro que antes separava as pessoas comuns dos sucessos de bilheteria e agora tem a capacidade de editar fotos como se estivesse dizendo algo.
Mas a magia nem sempre funciona como você deseja. Se você quer realizar seus sonhos com precisão, "feitiços" são a chave.
Existem algumas dicas para prestar atenção ao falar com a IA
Usar IA para editar fotos pode parecer novidade, mas o que ela realmente faz é uma aplicação avançada das conhecidas fotos Wensheng.
Como o nome sugere, a IA recebe uma descrição nossa, entende nossas intenções a partir dela e, finalmente, gera uma imagem que corresponde ao seu entendimento.
A dificuldade aqui é: que tipo de palavras são fáceis para a IA entender?
Preparei uma foto que eu queria processar, usando pãezinhos de feijão como exemplo, e testei os efeitos de diferentes palavras-chave.
Primeiro, se eu simplesmente descrever:
Edite esta foto para deixá-la bonita.
Neste ponto, a IA realizou um processamento básico na foto. Podemos ver claramente que o contraste da imagem ficou mais forte e as cores mais ricas, mas não estou satisfeito com esse processamento.
Esta foto foi tirada à noite. O maior problema é que a imagem não está transparente o suficiente e as camadas não são ricas o suficiente. Em vez de melhorar o contraste e a saturação, prefiro ajustar o estilo geral.
Olhando para o meu prompt, havia apenas um vago "bonito", mas "bonito" é uma sensação extremamente subjetiva. A IA não consegue perceber as preferências estéticas do usuário através da tela e só pode confiar no estilo estético predominante predefinido para ajudar a processar a imagem. No final, obtive um "guerreiro da saturação".
Mas se você alterar a descrição para:
Alterar o horário em que esta foto foi tirada para azul.
Com uma descrição mais clara e objetiva, as imagens geradas por IA estão claramente mais alinhadas aos requisitos. Com base na aparência natural, os tons de azul são mais proeminentes e o contraste entre cores quentes e frias na imagem é mais intenso. Mas isso não é suficiente.
O feitiço descrito em uma única dimensão não é preciso o suficiente, e a IA pode cometer erros. Ao mesmo tempo, devido à diferença de horário entre o pôr do sol e o acendimento das luzes da cidade, as luzes da cidade não estavam acesas quando a foto foi tirada, e a foto em si não refletiu a prosperidade da cidade, o que é bastante lamentável.
Para deixar esta foto melhor, podemos preparar uma sugestão mais abrangente para a IA.
Portanto, expandimos ainda mais a descrição para:
Altere o tempo de captura desta foto para azul, adicione algumas luzes lógicas aos prédios na imagem e adicione luzes de posição aos prédios altos à distância para criar um efeito de transparência interna na imagem. Preste atenção à racionalidade da iluminação.
As palavras-chave que descreveram nossa intenção de mais ângulos obtiveram resultados muito bons. Ao destacar os tons de azul, a IA adicionou iluminação lógica aos prédios na imagem, criando uma foto de cena noturna urbana em camadas.
Neste ponto, podemos resumir um conjunto de metodologias para fornecer à IA descrições precisas e transmitir nossas intenções com a maior precisão possível.
"Assunto + Tempo/Ambiente + Luz/Tom + Estilo/Humor + Efeitos Especiais + Restrições de Detalhes"
A fórmula consiste em seis partes, cada uma representando uma dimensão diferente de uma foto:
- Assunto: O objeto principal que você deseja que a IA processe, como esta foto de retrato, esta cena noturna da cidade
- Hora/Ambiente: a hora ou as condições naturais que você deseja que a foto mostre, como noite, céu azul, manhã cedo, dia de neve
- Luz/tom: A atmosfera visual que você deseja realçar ou alterar, como tons quentes, luz fria, luz do pôr do sol e transparência
- Estilo/Humor: O sentimento geral ou tom que a foto quer transmitir, como uma cidade movimentada ou uma cena noturna tranquila.
- Efeitos especiais: elementos visuais adicionais que você deseja adicionar ou modificar, como luzes de edifícios, reflexos na água e estrelas no céu
- Restrições de detalhes: Requisitos suplementares para a racionalidade e autenticidade da saída de IA, como: iluminação em conformidade com a lógica arquitetônica, atenção à perspectiva realista e prevenção de suavização excessiva da pele.
De acordo com essa fórmula, podemos controlar cada elemento da foto ao máximo. Quanto mais abrangente, mais precisa a IA consegue entender.
Ainda usando esta foto, usamos esta fórmula para escrever uma palavra-chave e ver se a IA pode nos fornecer uma foto de um estilo diferente:
Esta foto (assunto) foi alterada para ser tirada em um dia chuvoso, ao entardecer, antes do anoitecer (horário), adicionando uma certa quantidade de neblina à imagem. A chuva e a neblina são iluminadas pelas luzes dos prédios, formando fios de seda no ar. A neblina pode cobrir parte dos prédios (efeito especial). Ao mesmo tempo, a luz e a sombra são remodeladas de acordo com a lógica (luz). Tenha cuidado para não alterar ou excluir os prédios e elementos existentes na foto (restrições de detalhes).
A neblina é natural, os tons são harmoniosos e o teto coberto pela chuva tem reflexos de luz lógicos. Esta foto é realmente inesperada.
Efeitos que antes exigiam uma pós-produção complexa para serem obtidos agora podem ser facilmente obtidos em menos de 30 segundos.
Vale ressaltar que, entre as dezenas de fotos que testei, o Doubao tem o melhor efeito de edição, seguido pelo ChatGPT. A fórmula de palavras-chave resumida no artigo consegue obter resultados muito bons em ambas as IAs.
Ferramentas de IA como Gemini e Qwen tendem a redesenhar, deixando traços mais visíveis de alteração na foto. Portanto, as duas primeiras são recomendadas para ajustes finos e polimentos.
Nesse ponto, fiquei surpreso com o quão poderosa a IA realmente é: você não precisa de nenhuma habilidade em edição de fotos, basta fornecer uma ideia completa e você pode obter uma foto quase perfeita.
Mas por outro lado, uma contradição um pouco clichê, mas que não pode ser ignorada, começou a atormentar meu coração.
Onde está a "verdade" de uma foto?
Com o suporte da tecnologia de IA, nossa criação e expressão se tornaram mais livres e ricas do que nunca.
A edição de fotos não é mais domínio exclusivo de profissionais; pessoas comuns também podem modificar e recriar fotos facilmente por meio de IA.
No entanto, enquanto nos divertíamos usando IA para editar nossos gatos e transformá-los em astronautas, surgiu uma contradição de longa data:
Aos olhos de algumas pessoas, a edição de fotos com IA faz com que as fotos se desviem da realidade e se tornem falsas; enquanto outros acham que isso é apenas para entretenimento pessoal e por que deveríamos usar requisitos tão rigorosos para medir uma foto.
Na era da transição tecnológica, disputas ideológicas como essa não são incomuns e têm se tornado cada vez mais acirradas.
Após ganhar o Sony World Photography Award com uma imagem gerada por IA, o fotógrafo alemão Boris Eldagsen se recusou ativamente a aceitar o prêmio e revelou a identidade de IA da imagem.
Fazer isso em uma competição de fotografia profissional de nível internacional não é brincadeira. Ele quer iniciar a discussão e enfatizar que devemos distinguir entre escrever com luz (fotografia) e escrever com prompts (geração de IA) para proteger a credibilidade das fotos.
▲ O trabalho de IA "False Memory: Electrician" que ganhou o Sony World Photography Award foi gerado pelo DALL-E 2
No entanto, este debate sobre a verdade pode ter confundido dois níveis diferentes de questões desde o início. Devemos distinguir entre dois contextos diferentes: um é a "verdade na esfera pública" e o outro é a "verdade na expressão pessoal".
Para evidências em tribunal ou uma foto de primeira página no The New York Times, a autenticidade objetiva e verificável é sua força vital, e a procedência de uma foto — quem a tirou, quando, onde e por quê — é o critério fundamental para julgar seu valor.
Neste contexto, qualquer modificação não declarada pode constituir fraude.
A IA de Trump pode ser transformada em um gato? Provavelmente não.
Mas para seu círculo de amigos, o verdadeiro significado é completamente diferente.
No reino privado do mundo digital, o que frequentemente buscamos é a verdade de uma emoção, a verdade de uma piada ou a verdade de uma estética.
Sim, quando vemos uma imagem de um gato ajudando a cozinhar, não nos sentimos enganados, apenas nos sentimos divertidos.
▲ Eu disse aos meus pais que meu gato cuidaria de mim na velhice, e eles não ficaram bravos comigo.
A verdade aqui não é sobre fatos, mas sobre expressão.
Essa pode ser a verdadeira razão pela qual pessoas comuns adotam a edição de fotos com IA: no campo da expressão pessoal, a intenção é um critério mais importante que o fato.
A intenção de um jornalista é testemunhar, e ele tem a responsabilidade de registrar os eventos da forma mais fiel possível; enquanto a intenção de uma pessoa comum é expressar, e ela tem o direito de transmitir suas emoções e criatividade de várias maneiras.
Então, voltando à pergunta original, vá em frente e faça nevar no equador e deixe os gatos pousarem na lua.
Nesta era da IA, no seu mundo particular, a imaginação é o único limite.
#Bem-vindo a seguir a conta pública oficial do WeChat do iFaner: iFaner (ID do WeChat: ifanr), onde mais conteúdo interessante será apresentado a você o mais breve possível.