Pode existir uma ferramenta precisa de marca d’água ChatGPT, mas a OpenAI não a lançará

chatGPT em um telefone em uma enciclopédia
Shantanu Kumar / Pexels

Os plagiadores do ChatGPT, tomem cuidado, pois a OpenAI desenvolveu uma ferramenta que é capaz de detectar a saída de escrita do GPT-4 com supostamente 99,99% de precisão. No entanto, a empresa passou mais de um ano debatendo se deveria ou não divulgá-lo ao público.

A empresa está adotando uma “abordagem deliberada” devido às “complexidades envolvidas e seu provável impacto no ecossistema mais amplo além do OpenAI”, de acordo com o TechCrunch . “O método de marca d'água de texto que estamos desenvolvendo é tecnicamente promissor, mas tem riscos importantes que estamos avaliando enquanto pesquisamos alternativas, incluindo a suscetibilidade de ser contornado por malfeitores e o potencial de impactar desproporcionalmente grupos como aqueles que não falam inglês”, um porta-voz da OpenAI disse.

O sistema de marca d'água de texto funciona incorporando um padrão específico na saída escrita do modelo que é detectável pela ferramenta OpenAI, mas invisível para o usuário final. Embora esta ferramenta possa detectar com segurança a escrita gerada por seu próprio mecanismo GPT-4, ela não pode detectar as saídas de outros modelos como Gemini ou Claude. Além do mais, a própria marca d'água pode ser removida executando a saída do texto no Google Translate, mudando-a para outro idioma e depois voltando.

Esta não é a primeira tentativa da OpenAI de construir uma ferramenta de detecção de texto. No ano passado, ele silenciosamente desativou um detector de texto semelhante que estava em desenvolvimento devido à baixa taxa de detecção da ferramenta e à propensão para falsos positivos. Lançado em janeiro de 2023, esse detector precisava que o usuário inserisse manualmente um texto de amostra com pelo menos 1.000 caracteres antes de poder fazer uma determinação. Ele conseguiu classificar corretamente o conteúdo gerado por IA com apenas 26% de precisão e rotulou o conteúdo gerado por humanos como derivado de IA em 9% das vezes. Isso também levou um professor da Texas A&M a ser reprovado incorretamente em uma turma inteira por supostamente usar o ChatGPT em suas tarefas finais.

A OpenAI também está hesitante em lançar a ferramenta por medo de uma reação do usuário. De acordo com o Wall Street Journal, 69% dos usuários do ChatGPT acreditam que tal ferramenta não seria confiável e provavelmente resultaria em falsas acusações de trapaça. Outros 30% relataram que abandonariam voluntariamente o chatbot em favor de um modelo diferente caso a OpenAI realmente implementasse o recurso. A empresa também teme que os desenvolvedores consigam fazer engenharia reversa da marca d'água e criar ferramentas para negá-la.

Mesmo enquanto a OpenAI debate os méritos de lançar seu sistema de marca d'água, outras startups de IA estão correndo para lançar seus próprios detectores de texto, incluindo GPTZero, ZeroGPT, Scribbr e Writer AI Content Detector. No entanto, dada a sua falta geral de precisão, o olho humano continua a ser o nosso melhor método para detectar conteúdo gerado por IA, o que não é tranquilizador.