O que é PhotoDNA e como funciona?
A internet facilitou muitas coisas, desde manter contato com amigos e familiares até conseguir um emprego e até trabalhar remotamente. Os benefícios desse sistema conectado de computadores são imensos, mas também há uma desvantagem.
Ao contrário dos estados-nação, a Internet é uma rede global que nenhum governo ou autoridade pode controlar. Consequentemente, o material ilegal acaba online e é extremamente difícil evitar que as crianças sofram e prender os responsáveis.
No entanto, uma tecnologia co-desenvolvida pela Microsoft chamada PhotoDNA é um passo em direção à criação de um espaço online mais seguro para crianças e adultos.
O que é PhotoDNA?
PhotoDNA é uma ferramenta de identificação de imagem, desenvolvida pela primeira vez em 2009. Embora seja principalmente um serviço apoiado pela Microsoft, foi co-desenvolvido pelo professor Hany Farid do Dartmouth College, um especialista em análise de fotos digitais. O objetivo do PhotoDNA é identificar imagens ilegais, incluindo material de abuso sexual infantil, comumente conhecido como CSAM.
À medida que smartphones, câmeras digitais e internet de alta velocidade se tornaram mais comuns, o mesmo aconteceu com a quantidade de CSAM encontrados online. Na tentativa de identificar e remover essas imagens, juntamente com outros materiais ilegais, o banco de dados PhotoDNA contém milhões de entradas de imagens conhecidas de abuso.
A Microsoft opera o sistema, e o banco de dados é mantido pelo National Center for Missing & Exploited Children (NCMEC), uma organização dedicada à prevenção do abuso infantil. As imagens vão para o banco de dados assim que forem relatadas ao NCMEC.
Embora não seja o único serviço de pesquisa de CSAM conhecidos, o PhotoDNA é um dos métodos mais comuns, incluindo muitos serviços digitais como Reddit, Twitter e a maioria dos produtos de propriedade do Google.
O PhotoDNA teve que ser fisicamente configurado localmente no início, mas a Microsoft agora opera o serviço PhotoDNA Cloud baseado em nuvem. Isso permite que organizações menores, sem uma vasta infraestrutura, realizem a detecção de CSAM.
Como funciona o PhotoDNA?
Quando os usuários da Internet ou agências de aplicação da lei encontram imagens de abuso, elas são denunciadas ao NCMEC por meio do CyberTipline . Eles são catalogados e as informações são compartilhadas com as autoridades policiais, caso ainda não o tenham feito. As imagens são carregadas para o PhotoDNA, que então cria um hash, ou assinatura digital, para cada imagem individual.
Para obter esse valor exclusivo, a foto é convertida em preto e branco, dividida em quadrados, e o software analisa o sombreamento resultante. O hash exclusivo é adicionado ao banco de dados do PhotoDNA, compartilhado entre as instalações físicas e o PhotoDNA Cloud.
Os fornecedores de software, agências de aplicação da lei e outras organizações confiáveis podem implementar a digitalização PhotoDNA em seus produtos, software em nuvem ou outros meios de armazenamento. O sistema verifica cada imagem, converte-a em um valor hash e compara-a com os hashes do banco de dados CSAM.
Se uma correspondência for encontrada, a organização responsável é alertada e os detalhes são passados para a aplicação da lei para processo. As imagens são removidas do serviço e a conta do usuário é encerrada.
É importante ressaltar que nenhuma informação sobre suas fotos é armazenada, o serviço é totalmente automatizado sem envolvimento humano e você não pode recriar uma imagem a partir de um valor hash.
Desde 2015, as organizações também podem usar o PhotoDNA para analisar vídeos.
Em agosto de 2021, a Apple quebrou o passo com a maioria das outras grandes empresas de tecnologia e anunciou que usaria seu próprio serviço para escanear iPhones de usuários para CSAM .
Compreensivelmente, esses planos receberam uma reação considerável por parecerem violar a postura favorável à privacidade da empresa, e muitas pessoas temeram que a varredura gradualmente incluiria não-CSAM, eventualmente levando a uma porta dos fundos para a aplicação da lei.
O PhotoDNA usa reconhecimento facial?
Atualmente, estamos bastante familiarizados com algoritmos. Essas instruções codificadas nos mostram postagens relevantes e interessantes em nossos feeds de mídia social, oferecem suporte a sistemas de reconhecimento facial e até mesmo decidem se teremos uma entrevista de emprego ou se entraremos na faculdade.
Você pode pensar que algoritmos estariam no centro do PhotoDNA, mas automatizar a detecção de imagens dessa forma seria altamente problemático. Por exemplo, seria incrivelmente invasivo, violaria nossa privacidade, sem falar que algoritmos nem sempre estão certos.
O Google, por exemplo, teve problemas bem documentados com seu software de reconhecimento facial. Quando o Google Fotos foi lançado, ele classificou erroneamente os negros como gorilas. Em março de 2017, um comitê de supervisão da Câmara ouviu que alguns algoritmos de reconhecimento facial estavam errados 15 por cento das vezes e mais propensos a identificar pessoas negras.
Esses tipos de algoritmos de aprendizado de máquina são cada vez mais comuns, mas podem ser desafiadores para monitorar de forma adequada. Efetivamente, o software toma suas próprias decisões e você deve fazer a engenharia reversa de como ele chegou a um resultado específico.
Compreensivelmente, dado o tipo de conteúdo que o PhotoDNA procura, o efeito da identificação incorreta pode ser catastrófico. Felizmente, o sistema não depende de reconhecimento facial e só pode encontrar imagens pré-identificadas com um hash conhecido.
O Facebook usa o PhotoDNA?
Como proprietário e operador das maiores e mais populares redes sociais do mundo, o Facebook lida com muito conteúdo gerado pelo usuário todos os dias. Embora seja difícil encontrar estimativas atuais confiáveis, a análise em 2013 sugeriu que cerca de 350 milhões de imagens são enviadas para o Facebook a cada dia.
Isso provavelmente será muito maior agora, à medida que mais pessoas aderiram ao serviço, a empresa opera várias redes (incluindo Instagram e WhatsApp) e temos acesso mais fácil a câmeras de smartphones e internet confiável. Dado o seu papel na sociedade, o Facebook deve reduzir e remover o CSAM e outros materiais ilegais.
Felizmente, a empresa abordou isso no início, optando pelo serviço PhotoDNA da Microsoft em 2011. Desde o anúncio, há mais de uma década, há poucos dados sobre a eficácia disso. No entanto, 91 por cento de todos os relatórios de CSAM em 2018 foram do Facebook e do Facebook Messenger.
O PhotoDNA torna a Internet mais segura?
O serviço desenvolvido pela Microsoft é, sem dúvida, uma ferramenta essencial. O PhotoDNA desempenha um papel crucial na prevenção da propagação dessas imagens e pode até ajudar a ajudar crianças em situação de risco.
No entanto, a principal falha do sistema é que ele só pode procurar imagens pré-identificadas. Se o PhotoDNA não tiver um hash armazenado, ele não poderá identificar imagens abusivas.
É mais fácil do que nunca tirar e fazer upload de imagens de abuso de alta resolução online, e os abusadores estão cada vez mais indo para plataformas mais seguras como a Dark Web e aplicativos de mensagens criptografadas para compartilhar o material ilegal. Se você nunca encontrou a Dark Web antes, vale a pena ler sobre os riscos associados ao lado oculto da Internet.