Spotify responde à coleta “nefasta” de 300 TB de dados por ativistas da internet.
Um popular serviço de armazenamento em nuvem afirma ter publicado um backup do Spotify como torrents em massa, totalizando 300 TB, ou aproximadamente 86 milhões de arquivos de música – e o Spotify confirmou a violação.
O grupo, chamado Anna's Archive, afirma possuir bancos de dados SQLite que contêm o maior banco de dados de metadados musicais disponível publicamente, abrangendo 256 milhões de faixas e 186 milhões de códigos ISRC únicos.
O Anna's Archive afirma que geralmente se concentra em textos por serem densos, mas sua missão é preservar conhecimento e cultura em diversas mídias. Alega também ter encontrado uma maneira de extrair dados do Spotify em larga escala e vê isso como um ponto de partida para a construção de um arquivo musical voltado para a preservação.
O Spotify respondeu enviando a seguinte declaração à Billboard : “O Spotify identificou e desativou as contas de usuários mal-intencionadas que se envolveram em raspagem ilegal de dados. Implementamos novas medidas de segurança para esses tipos de ataques contra direitos autorais e estamos monitorando ativamente qualquer comportamento suspeito.”
“Desde o primeiro dia, estamos ao lado da comunidade artística na luta contra a pirataria e trabalhamos ativamente com nossos parceiros do setor para proteger os criadores e defender seus direitos.”
O que está incluído na versão do banco de dados
Em seu artigo, o grupo argumenta que a música já está razoavelmente bem preservada, mas aponta três lacunas: uma longa lista de obras que só são salvas quando alguém se importa o suficiente (e os torrents podem ter baixa disponibilidade), uma tendência audiófila em direção a arquivos lossless enormes que torna difícil preservar "tudo", e a falta de uma lista oficial de torrents que represente toda a música gravada.
O seu pacote de metadados do Spotify é apresentado como a solução. Alega cobertura de metadados para cerca de 99,9% dos artistas, álbuns e faixas, com o conjunto de dados principal de artistas, álbuns e faixas com menos de 200 GB comprimidos, além de um conjunto de dados separado para análise de áudio com 4 TB comprimidos.
Segundo o blog, o Anna's Archive afirma ter arquivado cerca de 86 milhões de arquivos de música, representando aproximadamente 99,6% das reproduções, mas planeja liberar esses arquivos em ordem de popularidade, e não de uma só vez.
Na prática, isso significa que, por enquanto, esse backup é apenas de metadados, com o áudio chegando posteriormente. No entanto, considerando a promessa bastante detalhada dos próximos passos feita pelo grupo, resta saber como, e se, o Spotify conseguirá interromper esse esforço.
O post Spotify responde à coleta 'nefasta' de 300 TB de dados por ativistas da internet apareceu primeiro em Digital Trends .

