Recuse a “Prostituição Branca”! Milhares de escritores se manifestam: IA generativa também tem que pagar taxas de direitos autorais

Afinal, a IA generativa baseada no modelo de linguagem grande ainda está "ultrajada"!

Mais de 8.500 autores de ficção, não-ficção e poesia assinaram recentemente uma carta aberta aos líderes em IA generativa pedindo aos CEOs da OpenAI, Alphabet, Meta, Stability AI, IBM e Microsoft que busquem consentimento, reconheçam e compensem de forma justa os autores que usam material protegido por direitos autorais durante o treinamento de IA.

"Técnicas de IA generativas baseadas em grandes modelos de linguagem devem sua existência ao nosso trabalho", diz a carta. "Essas técnicas imitam e introspectam nossa linguagem, histórias, estilos e ideias."

Esta afirmação pode ser tendenciosa, mas quando olhamos como funciona a tecnologia generativa de IA, não é irracional.

Especificamente, a IA generativa funciona usando modelos de aprendizado de máquina para aprender padrões e relacionamentos em conjuntos de dados de conteúdo criados por humanos e, em seguida, usando os padrões aprendidos para gerar novo conteúdo. Entre eles, os dados pré-treinados servem como combustível "petróleo".

Tomando o atualmente popular ChatGPT como exemplo, os dados públicos mostram que o volume de dados de treinamento do ChatGPT é um corpus de linguagem de 800 bilhões de palavras, incluindo 175 bilhões de parâmetros, e o volume de dados de pré-treinamento atinge 45 TB.

Curiosamente, a fonte de um conjunto de dados tão grande do ChatGPT sempre foi "coberta de névoa".

Funcionários da OpenAI afirmaram que, em vista da situação competitiva e das implicações de segurança de modelos de grande escala, como o GPT-4, ela não divulga mais informações sobre a fonte de seus conjuntos de dados e afirmou vagamente que vem principalmente da Internet, mídia social, notícias, livros etc.

No artigo que apresenta o ChatGPT-3 em 2020, a OpenAI, que ainda não explodiu, admitiu francamente que 15% de seu conjunto de dados de treinamento veio de "2 corpora de livros baseados na Internet". Embora a OpenAI não tenha divulgado explicitamente quais são esses conjuntos de dados, muitos denunciantes afirmam que esses conjuntos de dados vêm da "biblioteca sombra" que fornece materiais de livros gratuitos para pessoas que violam os direitos autorais.

Em fevereiro deste ano, a OpenAI foi acusada por muitos meios de comunicação de usar seus artigos para treinamento sem autorização. Quando um repórter do Wall Street Journal pediu ao ChatGPT uma lista das fontes de notícias nas quais foi treinado, a resposta que recebeu listou 20 veículos de mídia, incluindo o Journal, que não foi autorizado. Será que outras IAs generativas que "sempre andam à beira do rio" realmente "não molham os pés"?

Então, em suma, é difícil não deixar esses escritores cheios de dúvidas sobre se seus direitos autorais foram danificados.

Mais importante, a carta aberta também mencionou que, na última década, a renda dos escritores caiu 40%, e a renda média atual dos escritores em tempo integral é de apenas US $ 23.000 em 2022. A invasão da IA ​​pode tornar a situação dos escritores mais difícil.

Portanto, os defensores também emitiram um pedido na carta, pedindo aos líderes da IA ​​generativa que fizessem as três coisas a seguir.
– obtenha permissão para usar nosso material protegido por direitos autorais, etc. em seus programas generativos de IA;
– compensar de forma justa os autores do passado e do presente que usam nosso trabalho em seus programas generativos de IA;
– compensar de forma justa os autores que usam nosso trabalho na saída de IA, independentemente de a saída violar a lei existente;

Agora a pressão está sobre os líderes da IA ​​generativa.

Você deve saber que muitos líderes da IA ​​generativa fizeram compromissos "verbais" mais rigorosos com a proteção de direitos autorais em público. Na audiência do Congresso dos EUA em maio deste ano, Altman, o "chefe" da OpenAI, enfatizou que os criadores de conteúdo se beneficiarão das ferramentas de IA e terão propriedade e controle sobre seus trabalhos. Desde então, Altman se tornou um "missionário" e viajou por países ao redor do mundo para torcer pela IA generativa.

O "tapa na cara" veio muito rápido, e agora os intermináveis ​​processos de vazamento de privacidade e incidentes de violação de direitos autorais colocaram completamente esta carta de apelação na mesa, e ela se tornou um inevitável "talismã da morte".

Só que desta vez, os líderes da IA ​​generativa estão fechando os olhos?

#Bem-vindo a seguir a conta pública oficial do WeChat de Aifaner: Aifaner (ID do WeChat: ifanr), conteúdo mais interessante será apresentado a você o mais rápido possível.

Ai Faner | Link Original · Ver comentários · Sina Weibo