As 5 melhores ferramentas para localizar e remover arquivos duplicados no Linux

O gerenciamento de arquivos é uma tarefa complicada por si só. Acrescente a esse grande volume de arquivos duplicados que normalmente ocupam o espaço de armazenamento, e o processo se torna cada vez mais difícil.

Embora a maneira padrão de lidar com arquivos duplicados seja localizá-los e excluí-los manualmente. No entanto, usar um programa localizador de arquivo duplicado dedicado pode acelerar significativamente o processo.

Portanto, se você está planejando se livrar de arquivos duplicados e limpar seu computador, aqui está uma lista de algumas das melhores ferramentas para localizar e remover arquivos duplicados no Linux.

1. Fslint

Fslint é um utilitário baseado em GUI e CLI para limpar vários tipos de desordem do seu sistema. Ele chama essa bagunça de "lint" e oferece várias ferramentas para ajudá-lo a realizar uma infinidade de tarefas, incluindo a localização de arquivos duplicados, diretórios vazios e nomes de arquivos problemáticos.

Ao apresentar os modos de operação gráfico e de linha de comando, o fslint torna mais fácil para os novos usuários do Linux liberar o armazenamento do computador de todos os tipos de lint do sistema.

Para acessar o fslint por meio da GUI, tudo o que você precisa fazer é abrir o terminal e executar o comando fslint-gui .

No que diz respeito à funcionalidade avançada, o programa oferece 10 funcionalidades diferentes no modo CLI, como findup, findu8, findnl, findtf e finded. Usando isso, você pode refinar os resultados da pesquisa para aumentar suas chances de encontrar tipos específicos de arquivos duplicados em seu sistema.

Como instalar o fslint

Em distros baseadas em Debian, como Ubuntu:

 sudo apt install fslint

Em distros baseadas em RHEL, como CentOS e Fedora:

 sudo yum install fslint
sudo dnf install fslint

No Arch Linux e Manjaro:

 sudo pacman -S fslint

2. Fdupes

Fdupes é um dos programas mais fáceis de identificar e excluir arquivos duplicados que residem em diretórios. Lançado sob a licença do MIT no GitHub, é gratuito e de código aberto.

O programa funciona usando assinatura md5sum e verificação de comparação byte a byte para determinar arquivos duplicados em um diretório. Se necessário, você também pode realizar pesquisas recursivas, filtrar os resultados da pesquisa e obter uma visão resumida dos arquivos duplicados descobertos.

Depois de identificar arquivos duplicados em um diretório, você pode usar fdupes para excluir os arquivos ou substituí-los por links para o arquivo original.

Instalação Fdupes

Em distros baseadas em Debian:

 sudo apt install fdupes

Em distros baseadas em RHEL:

 sudo yum install fdupes
sudo dnf install fdupes

Para instalar no Arch Linux e Manjaro:

 sudo pacman -S fdupes

Relacionado: Como encontrar e remover arquivos duplicados no Linux usando fdupes

3. Rdfind

Rdfind é outro utilitário do Linux para ajudá-lo a encontrar arquivos redundantes em seu computador em diferentes diretórios. Ele se baseia na comparação de arquivos com base em seu conteúdo – e não em seu nome – para identificar duplicatas, o que o torna mais eficaz em seu trabalho.

Para conseguir isso, o programa funciona classificando arquivos iguais em um diretório e determinando o original e as duplicatas: o mais bem classificado é selecionado como o original, enquanto o resto são duplicatas.

Além disso, o rdfind também pode calcular somas de verificação para comparar arquivos quando necessário. E a melhor parte é que ele salva os resultados da varredura em um arquivo results.txt no diretório inicial, para que você possa consultá-lo quando estiver prestes a excluir duplicatas para garantir que não removerá as erradas.

Claro, como a maioria dos outros localizadores de arquivos duplicados, o rdfind também oferece alguns pré-processadores para classificar arquivos, ignorar arquivos vazios ou definir links simbólicos. Por último, mas não menos importante, há uma opção para excluir arquivos duplicados também.

Relacionado: O que é um link simbólico (link simbólico)? Como criar um no Linux

Como instalar o rdfind

No Debian / Ubuntu:

 sudo apt install rdfind

No Fedora / CentOS:

 sudo dnf install rdfind

4. DupeGuru

DupeGuru é uma ferramenta de plataforma cruzada para localizar e excluir arquivos duplicados em sua máquina. Uma de suas melhores características é a opção de customizar o mecanismo de correspondência de acordo com sua preferência, de modo a aumentar suas chances de encontrar o tipo certo de arquivos duplicados em um diretório. E semelhante a alguns outros programas localizadores de duplicatas, também oferece uma GUI para facilitar as operações.

Por falar em funcionalidade, o dupeGuru aproveita seu algoritmo de correspondência difusa para escanear nomes de arquivos ou conteúdo de arquivos e encontrar duplicatas com rapidez e eficiência.

Além disso, também é bom para lidar com informações específicas de músicas e imagens, o que oferece uma vantagem sobre outros localizadores de arquivos duplicados. Além disso, se necessário, você tem a opção de ajustar seu mecanismo de correspondência para localizar exatamente o tipo de arquivos duplicados que deseja eliminar.

DupeGuru também permite excluir arquivos duplicados. E para isso, possui um sistema de diretório de referência, que evita que você apague acidentalmente os arquivos errados. Além da exclusão, existe a opção de movê-los ou copiá-los para outro lugar também.

Instalação DupeGuru

Em distros baseadas em Debian:

 sudo add-apt-repository ppa:dupeguru/ppa
sudo apt-get update
sudo apt-get install dupeguru

No Arch Linux:

 sudo pacman -S dupeguru

5. Rmlint

Rmlint é mais um lint – e não apenas arquivos duplicados – localizador e removedor para Linux. É de uso gratuito e extremamente rápido na identificação de arquivos e diretórios duplicados em seu sistema. Você também obtém suporte para o formato de armazenamento Btrfs, o que o destaca das outras ferramentas desta lista.

Falando nisso, alguns dos outros aspectos em que o rmlint supera as outras ferramentas concorrentes de remoção de arquivos duplicados incluem a capacidade de pesquisar arquivos com base em um período de tempo específico, encontrar arquivos com IDs de usuário / grupo quebrados e encontrar binários não eliminados que ocupam muito do espaço. Além disso, semelhante a alguns outros programas, ele também economiza os resultados digitalizados para arquivos rmlint.json e rmlint.sh, que vêm a calhar durante a operação de exclusão.

No entanto, observe que, ao contrário de outras ferramentas, rmlint não é a mais fácil de usar: ele gera um script para excluir duplicatas, o que requer algum nível de conhecimento para ser usado de forma eficaz.

Como instalar o rmlint

Em distros baseadas em Debian:

 sudo apt install rmlint

No Fedora e CentOS:

 sudo yum install rmlint
sudo dnf install rmlint

Em distros baseadas em Arch como Manjaro:

 sudo pacman -S rmlint

Mantendo arquivos duplicados à distância no Linux

Usando os programas localizadores de arquivos duplicados listados acima, você pode identificar facilmente os arquivos duplicados que podem estar ocupando espaço em sua máquina e removê-los completamente. No entanto, um conselho ao trabalhar com essas ferramentas é ser extremamente cauteloso com suas ações para evitar a exclusão de arquivos e documentos importantes em seu sistema.

Caso você esteja um pouco cético sobre quais arquivos excluir e quais manter, certifique-se de fazer um backup de todos os dados em seu sistema para ficar mais seguro.