O modelo mais recente da OpenAI cria imagens realistas e texto legível, experimente gratuitamente

OpenAI introduziu seu modelo 4o no ChatGPT para permitir a geração de imagens nativas na atmosfera do chatbot. Esta atualização faz com que você não precise usar o modelo de geração de imagens Dall-E da OpenAI como uma entidade separada, embora o Dall-E permaneça disponível para aqueles como preferência. A marca AI também habilitou seu gerador de vídeo Sora AI no ChatGPT.

Os novos recursos estão atualmente disponíveis para usuários ChatGPT gratuitos, bem como para usuários ChatGPT Plus , Team e Pro. A disponibilidade chegará para usuários corporativos e educacionais na próxima semana.

Imagem gerada pela OpenAI - Uma foto espontânea no estilo paparazzi de Karl Marx caminhando apressadamente pelo estacionamento do Mall of America. Imagem gerada pela OpenAI - Fotografia realista de um cavalo galopando da direita para a esquerda em uma vasta e calma superfície do oceano. Imagem gerada pela OpenAI - imagem fotorrealista do mercado de agricultores em Toronto em um sábado do verão de 2006.

Anteriormente, o Dall-E 3 era o plug-in de geração de imagens para assinantes pagos do ChatGPT. Enquanto isso, aqueles que quisessem experimentar o gerador gratuitamente poderiam fazê-lo por meio do nível básico do Microsoft Copilot .

O modelo tem sido elogiado como um dos principais geradores de imagens disponíveis, principalmente na versão paga. Apesar do benefício de todos os usuários do ChatGPT poderem usar a geração de imagens nativamente com o modelo 4o, aqueles que usam o nível gratuito do ChatGPT devem estar preparados para enfrentar algumas limitações, como máximos para upload de arquivos e análise de dados, observou a CNET .

Mesmo assim, o ChatGPT se beneficiará por ter imagens mais realistas com texto mais legível depois que a OpenAI passou um ano fazendo o GPT-4o passar por um esforço de treinamento pós-lançamento chamado “aprendizado por reforço a partir de feedback humano” (RLHF), de acordo com o Wall Street Journal .

Depois de anunciar o GPT-4o em maio de 2024, a OpenAI tinha uma equipe de mais de 100 “treinadores humanos” vasculhando o modelo em busca de erros de digitação, bem como erros comuns em mãos e rostos, disse o pesquisador principal do projeto, Gabriel Goh, à publicação.

O modelo GPT-4o também trará ao ChatGPT a capacidade de criar fundos transparentes. Este deve ser um grande benefício para usuários empresariais e criativos, pois lhes permitirá criar logotipos ou outras iconografias, observou Jackie Shannon, líder de produto multimodal do ChatGPT, ao WSJ.

Apesar das melhorias que a OpenAI fez, o modelo GPT-4o atualizado como um todo ainda tem suas deficiências. Ele ainda tem propensão a alucinações, que é uma característica comum da IA ​​que ainda não foi resolvida. Manter a consistência da edição continua sendo um desafio na atmosfera do ChatGPT; no entanto, a OpenAI prometeu atualizações rápidas já na próxima semana.

Outra questão constante para OpenAI é a questão da ética e da legalidade. A marca insiste que seu modelo foi treinado em “dados disponíveis publicamente” e por meio de dados proprietários que possui por meio de parcerias com marcas como a Shutterstock, observou o WSJ.

As imagens geradas através do ChatGPT baseadas no modelo 4o não terão marcas d'água de IA. No entanto, a marca indicou que as imagens incluirão metadados C2PA⁠ denotando-as como geradas por IA. Este continua sendo o padrão da indústria.