Ao trabalhar com grandes quantidades de mídia e documentos, é bastante comum acumular várias cópias do mesmo arquivo em seu computador. Inevitavelmente, o que se segue é um espaço de armazenamento desordenado cheio de arquivos redundantes, provocando verificações periódicas de arquivos duplicados em seu sistema.

Para isso, você encontrará vários programas para identificar e excluir arquivos duplicados. E o fdupes é um desses programas para Linux. Portanto, acompanhe enquanto discutimos fdupes e o guie pelas etapas para localizar e excluir arquivos duplicados no Linux.

O que é fdupes?

Fdupes é um programa baseado em CLI para localizar e excluir arquivos duplicados no Linux. É lançado sob a licença do MIT em GitHub.

Em sua forma mais simples, o programa funciona executando o diretório especificado por meio de md5sum para comparar o MD5 assinaturas de seus arquivos. Em seguida, ele executa uma comparação byte a byte neles para identificar os arquivos duplicados e garantir que nenhuma duplicata seja deixada de fora.

Depois que o fdupes identifica os arquivos duplicados, ele oferece a opção de excluí-los ou substituí-los por links físicos (links para os arquivos originais). Portanto, dependendo de seus requisitos, você pode prosseguir com uma operação de acordo.

Como instalar o fdupes no Linux?

O Fdupes está disponível na maioria das principais distros Linux, como Ubuntu, Arch, Fedora, etc. Com base na distro que você está executando em seu computador, execute os comandos fornecidos a seguir.

Em sistemas baseados em Ubuntu ou Debian:

sudo apt install fdupes

Para instalar fdupes no Fedora / CentOS e outras distros baseadas em RHEL:

sudo dnf install fdupes

No Arch Linux e Manjaro:

sudo pacman -S fdupes

Como usar fdupes?

Depois de instalar o programa em seu computador, siga as etapas abaixo para localizar e remover arquivos duplicados.

Encontrar arquivos duplicados com fdupes

Primeiro, vamos começar pesquisando todos os arquivos duplicados em um diretório. A sintaxe básica para isso é:

caminho do fdupes / para / diretório

Por exemplo, se você deseja encontrar arquivos duplicados no Documentos diretório, você executaria:

fdupes ~ / Documents

Saída:

Se fdupes encontrar arquivos duplicados no diretório especificado, ele retornará uma lista de todos os arquivos redundantes agrupados por conjunto, e você poderá realizar outras operações neles conforme necessário.

No entanto, se o diretório especificado consistir em subdiretórios, o comando acima não identificará duplicatas dentro deles. Em tais situações, o que você precisa fazer é realizar uma pesquisa recursiva para encontrar todos os arquivos duplicados presentes nos subdiretórios.

Para realizar uma pesquisa recursiva em fdupes, use o -r bandeira:

fdupes -r caminho / para / diretório

Por exemplo:

fdupes -r ~ / Documentos

Saída:

Embora os dois comandos acima possam localizar facilmente arquivos duplicados dentro do diretório especificado (e seus subdiretórios), sua saída também inclui arquivos duplicados de comprimento zero (ou vazios).

Embora esta funcionalidade ainda possa ser útil quando você tem muitos arquivos duplicados vazios em seu sistema, pode causar confusão quando você só deseja descobrir duplicatas não vazias em um diretório.

Felizmente, o fdupes permite que você exclua arquivos de comprimento zero de seus resultados de pesquisa usando o -n opção, que você pode usar em seus comandos.

Observação: Você pode excluir arquivos duplicados não vazios em pesquisas normais e recursivas.

Para pesquisar apenas arquivos duplicados não vazios em sua máquina:

fdupes -n ~ / Documentos

Saída:

Se você estiver lidando com vários conjuntos de arquivos duplicados, é aconselhável gerar os resultados em um arquivo de texto para referência futura.

Para fazer isso, execute:

caminho fdupes / para / diretório> nome_arquivo.txt

...Onde caminho / para / diretório é o diretório no qual você deseja realizar a pesquisa.

Para procurar arquivos duplicados no Documentos diretório e, em seguida, envie a saída para um arquivo:

fdupes / home / Documentos> output.txt

Por último, mas não menos importante, se desejar ver um resumo de todas as informações relacionadas a arquivos duplicados em um diretório, você pode usar o -m sinalizar em seus comandos:

fdupes -m caminho / para / diretório

Para obter informações de arquivo duplicado para o Documentos diretório:

fdupes -m ~ / Documentos

Saída:

A qualquer momento durante o uso de fdupes, se quiser ajuda com um comando ou função, use o -h opção para obter ajuda de linha de comando:

fdupes -h

Excluindo arquivos duplicados no Linux com fdupes

Depois de identificar os arquivos duplicados em um diretório, você pode prosseguir com a remoção / exclusão desses arquivos do sistema para limpar a desordem e liberar espaço de armazenamento.

Para excluir um arquivo duplicado, especifique o -d sinalize com o comando e pressione Digitar:

fdupes -d caminho / para / diretório

Para remover arquivos duplicados no Transferências pasta:

fdupes -d ~ / Downloads

O Fdupes agora apresentará uma lista de todos os arquivos duplicados naquele diretório e lhe dará a opção de preservar aqueles que deseja manter em seu computador.

Por exemplo, se você deseja preservar o primeiro arquivo no conjunto 1, insira 1 após a saída de uma pesquisa fdupes e clique Digitar.

Além disso, se necessário, você também pode salvar várias instâncias de arquivo em um conjunto de arquivos duplicados retornados. Para isso, você precisa inserir os números correspondentes aos arquivos duplicados em uma lista separada por vírgulas e pressionar Digitar.

Por exemplo, se você deseja salvar os arquivos 1, 3 e 5, você precisa inserir:

1,3,5

Caso queira preservar a primeira instância de um arquivo em cada conjunto de arquivos duplicados e deseja ignorar o prompt, você pode fazer isso incluindo o -N switch, conforme mostrado no seguinte comando:

fdupes -d -N caminho / para / diretório

Por exemplo:

fdupes -d -N ~ / Documentos

Excluindo com sucesso arquivos duplicados no Linux

Organizar arquivos é uma tarefa tediosa por si só. Acrescente a isso os problemas que os arquivos duplicados causam e você terá algumas horas de tempo e esforço desperdiçados na organização de seu armazenamento desordenado.

Mas, graças a utilitários como o fdupes, é muito mais fácil e eficiente identificar arquivos duplicados e excluí-los. E o guia acima deve ajudá-lo com essas operações em sua máquina Linux.

Assim como os arquivos duplicados, as palavras duplicadas e as linhas repetidas em um arquivo também podem ser frustrantes e exigem a remoção de ferramentas avançadas. Se você enfrentar esses problemas, também pode usar uniq para remover linhas duplicadas de um arquivo de texto.

CompartilhadoTweetO email
Como encontrar dados duplicados em um arquivo de texto Linux com uniq

Se você tiver um arquivo de texto com conteúdo duplicado que deseja remover, é hora de aprender a usar o comando uniq.

Leia a seguir

Tópicos relacionados
  • Linux
  • Gerenciamento de arquivos
  • Comandos Linux
Sobre o autor
Yash Wate (23 artigos publicados)

Yash é redator da equipe da MUO para DIY, Linux, Programação e Segurança. Antes de encontrar sua paixão pela escrita, ele desenvolvia para web e iOS. Você também pode encontrar seus escritos no TechPP, onde ele cobre outros setores. Além de tecnologia, ele gosta de falar sobre astronomia, Fórmula 1 e relógios.

Mais de Yash Wate

Assine a nossa newsletter

Junte-se ao nosso boletim informativo para dicas de tecnologia, análises, e-books grátis e ofertas exclusivas!

Clique aqui para se inscrever