Por trás da explosão do ChatGPT, quem o ajudou a “lavar o branco”
O sucesso da inteligência artificial não se deve apenas aos gênios do topo da pirâmide.
A IA não reconhece objetos e requer muitos dados para aprender a distinguir características faciais e semáforos.
A IA não recusa informações, contando com humanos para ajudá-la a eliminar partes prejudiciais do banco de dados.
Quando a IA finalmente brilha no centro das atenções, os anotadores de dados realizam suas tarefas monótonas, mas importantes, e depois desaparecem no escuro.
O ChatGPT, que é popular em todo o mundo, provavelmente também é uma história de "um terá sucesso e todos morrerão".
"Heróis nos bastidores" do ChatGPT
Nem é preciso dizer o quão poderoso é o ChatGPT. Ele fala com você em linguagem natural, escreve código, escreve trabalhos, passa em exames e cria poesia.
Comparado com o "retardo mental artificial" anterior, o GPT-3, o antecessor do ChatGPT, também é uma grande melhoria, mas tem o problema de ser fácil deixar escapar violência, sexismo e comentários racistas, por isso não pode ser realmente popularizado .
Com as lições aprendidas no passado, para garantir que o ChatGPT seja gentil e inofensivo, a OpenAI estabeleceu um mecanismo de segurança adicional.
▲ Foto de: Shutterstock
Com base em exemplos envolvendo violência, ódio e abuso sexual, ele treina uma IA que pode detectar conteúdo prejudicial e, em seguida, usa essa IA como um detector, integrado ao ChatGPT, para detectar e filtrar o conteúdo antes que chegue aos usuários.
Os exemplos acima precisam passar pela rotulagem de dados (rotulagem de dados), que é um enorme trabalho humano, e os trabalhadores no Quênia são responsáveis por rotular conteúdos nocivos.
Desde novembro de 2021, a OpenAI enviou dezenas de milhares de fragmentos de texto para a empresa de terceirização Sama, a maioria dos quais reflete os cantos mais sombrios da Internet, envolvendo abuso sexual, suicídio, tortura etc.
▲ Foto de: Sama
Um rotulador de dados começou a ter alucinações recorrentes depois de ler conteúdo inaceitavelmente nocivo.
A carga de trabalho não foi trocada por um tratamento superior.
A investigação da Time descobriu que os rotuladores de dados da Sama que trabalham para a OpenAI ganham cerca de US$ 1,32 a US$ 2 por hora. Trabalhando em turnos de nove horas, eles liam e anotavam de 150 a 250 parágrafos de texto, variando de 100 a mais de 1.000 palavras cada.
Mas Sama diz que os trabalhadores podem anotar 70 parágrafos por turno de nove horas, em vez do máximo de 250, e ganhar entre US$ 1,46 e US$ 3,74 por hora após impostos.
A Sama também se descreve como uma “empresa de IA ética” que tirou mais de 50.000 pessoas da pobreza.
Se ser moral significa ajudar a sair da pobreza, então talvez não haja nada de errado nisso, afinal esses trabalhadores pobres não têm mais opções.
Mas os "efeitos colaterais" são como uma sombra, e a tortura física e mental tornou-se um preço necessário.
Como a Sama tem exigências extremamente altas para a eficiência do trabalho dos funcionários, a empresa raramente organiza atividades de aconselhamento psicológico, sem contar que essas atividades em si não servem para nada. Alguns funcionários se ofereceram para consultas individuais, mas a administração da Sama recusou repetidamente.
A OpenAI também respondeu à mídia estrangeira Quartz que paga quase o dobro de outras empresas de revisão de conteúdo na África Oriental e fornece benefícios e pensões aos funcionários.
Embora as partes tenham opiniões diferentes, os fatos básicos não são diferentes.
A fim de tornar a IA mais segura e fazer com que a IA geral da OpenAI beneficie a humanidade, um grande número de trabalhadores pagou muita energia e até sofreu traumas. Mas quando a OpenAI foi avaliada em quase US$ 30 bilhões, eles permaneceram amplamente desconhecidos.
capilares terminais
Rotuladores de dados não são um trabalho novo.
Já em 2007, o especialista em visão computacional Fei-Fei Li contratou um grupo de alunos de graduação de Princeton para experimentar a rotulagem de dados por US$ 10/hora.
Hoje, a rotulagem de dados já se tornou uma indústria, mas o salário caiu significativamente e os protagonistas não são mais universitários.
Por volta de 2019, alguns meios de comunicação noticiaram sobre rotuladores de dados domésticos que estavam espalhados em cidades de quarto e quinto nível em Henan, Shandong, Hebei e outros lugares.
Da mesma forma, a Sama está sediada em San Francisco e emprega funcionários no Quênia, Uganda e Índia. Além do OpenAI, também rotula dados para clientes do Vale do Silício, como Google, Meta e Microsoft.
No entanto, nos últimos dois anos, Sama decidiu "lavar as mãos na bacia dourada".
Em fevereiro de 2022, Sama decidiu encerrar sua cooperação com a OpenAI. Os funcionários não precisam mais suportar a dor, mas os meios de subsistência também são difíceis de manter. “Para nós, esta é uma maneira de sustentar nossa família.”
Em janeiro deste ano, a atitude de Sama foi ainda mais decisiva: ele planejava deixar todo o trabalho de processamento de linguagem natural e revisão de conteúdo, apenas fazer anotações de dados de visão computacional e se separar de todos os negócios envolvendo conteúdo sensível, inclusive rescindindo o contrato com a Meta em Este de África.
A equipe da Sama, que trabalha para a Meta, em seu escritório em Nairóbi na África, concentra-se em revisar o conteúdo produzido localmente, e decapitações, abuso infantil e coisas do tipo são mais do que eles podem lidar. Um funcionário descreveu a revisão do conteúdo das imagens como "vivendo em um filme de terror".
Onde há demanda, há mercado, e nunca faltam essas empresas de terceirização.
A Majorel, uma empresa de terceirização com sede em Luxemburgo responsável pelos serviços de moderação do TikTok na África, deve assumir o trabalho da Meta.
A empresa também foi criticada. Em agosto de 2022, o Insider investigou a situação em Majorel, Marrocos, e descobriu que os trabalhadores frequentemente trabalhavam em turnos por mais de 12 horas, marcavam vídeos curtos envolvendo crueldade contra animais, violência sexual etc. e tinham menos tempo de descanso do que seus colegas americanos. O “consultor de saúde” da empresa ajudou Nada a fazer.
Como capilares no final da cadeia da indústria de tecnologia, a anotação de dados aparece em mais lugares.
Em novembro de 2022, The Verge relatou que a Amazon contratou trabalhadores na Índia e na Costa Rica responsáveis por assistir a milhares de vídeos de câmeras de depósito para melhorar o sistema de visão computacional da Amazon.
▲ Foto de: Reuters
Mas, olhando para ele por pelo menos oito horas, eles desenvolveram dores de cabeça, dor nos olhos e perda de visão.
Os carros autônomos também precisam de rotulagem de dados para aprender a reconhecer sinais de trânsito, veículos, pedestres, árvores e lixeiras, o que exige uma precisão ainda maior na rotulagem, pois pode determinar diretamente a vida e a morte das pessoas.
Uma investigação do MIT Technology Review de abril de 2022 descobriu que empresas de direção autônoma, incluindo a Tesla, tinham trabalhadores venezuelanos anotando dados de direção autônoma por um salário médio de pouco mais de 90 centavos de dólar por hora.
Pelo menos por enquanto, o banco de dados ainda precisa de purificação humana, e o reconhecimento de mapa AI ainda precisa de seres humanos para desenhar o quadro. O problema é que comparado com a energia que eles colocam, o tratamento e a saúde mental dos trabalhadores não são tão ideais.
aqueles que estão cada vez mais marginalizados
Desde o nascimento do ChatGPT, muitas pessoas se preocupam com seus empregos, o que pode ser uma sensação muito específica de crise.
Ao mesmo tempo, a relação entre IA e humanos passou por mudanças sutis em outra dimensão – mudou a forma como os humanos trabalham e os tipos de empregos existentes, permitindo que um grande número de trabalhadores se esconda nos bastidores.
Por exemplo, rotuladores de dados, cujo limite de trabalho não é alto, geralmente não têm requisitos acadêmicos rígidos e podem ser contratados após alguns dias de treinamento. Se você sabe o que marcar e onde marcar , basicamente está começando, e o resto do tempo é deixado para a prática leva à perfeição.
Eles geralmente não são funcionários regulares, mas formas terceirizadas, como trabalhadores quenianos que atendem a OpenAI.
Isso significa que eles vivem em um mundo mais instável, com salários mais baixos, status mais marginal e menos voz no local de trabalho, apenas seguindo o exemplo. Até onde a IA está indo, eles podem não saber.
Em 2018, a GQ relatou em "Those Who Work for Artificial Intelligence" que: "Não temos recursos de pesquisa e desenvolvimento e somos puramente uma (fundição) Foxconn."
▲ Movimento Ludita.
Situações semelhantes aconteceram na história. Na Grã-Bretanha, no início do século XIX, as máquinas têxteis automatizadas tornaram-se populares e as fábricas preferiram contratar mão-de-obra barata e não qualificada para operar as máquinas, resultando no desemprego de muitos trabalhadores manuais qualificados.
A roda dos tempos continua avançando e os rotuladores de dados que atendem à IA estão lentamente sendo substituídos pela IA.
Em junho de 2022, a Tesla planeja demitir 200 funcionários dos EUA responsáveis por fazer anotações em vídeos e ajudar a melhorar os sistemas de assistência ao motorista. A razão pode ser que a rotulagem automatizada de dados da Tesla progrediu nos últimos anos, o que pode substituir parte do trabalho feito por humanos.
O diretor de software da Tesla Autopilot disse uma vez no AI Day que a empresa pode coletar e rotular automaticamente 10.000 videoclipes de 45 a 60 segundos em uma semana. Em contraste, "rotular manualmente cada segmento pode levar meses".
Em 2020, o Fórum Econômico Mundial previu que até 2025, 85 milhões de empregos serão substituídos por máquinas e 97 milhões de novos empregos serão criados.
As posições sobre as quais eles estão otimistas são basicamente talentos técnicos, como especialistas em inteligência artificial e aprendizado de máquina, especialistas em transformação digital e analistas de segurança da informação.
Em contraste, as ocupações de baixa renda e baixa qualificação estão gradualmente saindo do palco e podem eventualmente desaparecer na sombra das máquinas.
#Bem-vindo a prestar atenção à conta pública oficial do WeChat de Aifaner: Aifaner (ID do WeChat: ifanr), conteúdo mais interessante será apresentado a você o mais rápido possível.