Microsoft cancela atualização do Dall-E após reclamações sobre qualidade de imagem

Robô segurando uma câmera de vídeo, gerada pelo Bing.
Solicitado por Alan Truly, gerado pelo Bing / Bing

A Microsoft teve que reverter sua última atualização para seu sistema Bing Image Generation , que instalou a última iteração do modelo Dall-E da OpenAI, chamado PR16, depois que os usuários do Bing reclamaram veementemente sobre um declínio na qualidade da imagem.

Quando a Microsoft anunciou a atualização pela primeira vez no ano passado, a empresa prometeu que o novo modelo seria “duas vezes mais rápido e com maior qualidade”. O chefe de pesquisa da empresa, Jordi Ribas, argumenta que os testes de benchmarking internos da Microsoft determinaram que a qualidade das imagens geradas pelo PR16 era “um pouco melhor em média” do que as saídas anteriores do Dall-E PR13. Não foi isso que os usuários viram. Um comentarista do subreddit do Bing lamentou: “O DALLE [sic] que costumávamos amar se foi para sempre”, porque as duas imagens abaixo são aparentemente diferentes o suficiente para justificar tal indignação? Parece assustador.

comparação de qualidade de imagem antes e depois da atualização do Bing
Reddit

Em resposta aos protestos, Ribas anunciou na terça-feira que a empresa reverterá o modelo subjacente de geração de imagens do Bing para a versão anterior até que possa resolver os problemas de qualidade com o PR16. Isso pode levar algumas semanas, no entanto.

“Conseguimos [reproduzir] alguns dos problemas relatados e planejamos voltar ao PR13 até que possamos corrigi-los”, escreveu Ribas em um post no X. “O processo de implantação é muito lento, infelizmente. Tudo começou há mais de uma semana e levará mais 2 a 3 semanas para chegar a 100%.”

A Microsoft e a OpenAI não estão sozinhas em seus problemas com o gerador de imagens. Em fevereiro de 2024, o Google teve que desativar temporariamente o modelo de imagem do Gemini depois que ele começou a retornar representações racialmente ofensivas de pessoas de cor, como nazistas negros.