shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Selecionar arquivos duplicados


From: Cristiano Ferrari
Subject: Selecionar arquivos duplicados
Date: Thu, 30 Apr 2009 12:01:27 -0000
User-agent: eGroups-EW/0.82

Ilustres, bom dia.

Estou fazendo uma faxina em meu servidor de arquivos e comecei por remover 
arquivos duplicados. Tipo aqueles que um usuário manda por e-mail para toda a 
empresa e 95% dos funcionários acham que precisam gravar uma cópia deles em sua 
pasta particular, "por precaução".

Como os nomes podem variar para o mesmo conteúdo, criei um script que gera um 
hash MD5 de todos os arquivos. A saída dele é uma lista parecida com isto:

e07be9609b0ac4975722916bb3da47f5  ./GBM/cebola/cebola superex 1.ppt
0bd338fddc4edc627f95eca0f78e96df  ./GBM/cebola/cebola2002.ppt
3445c95f79bd8979c97d8947133e0d20  ./GBM/cebola/cebola2002b.ppt
119c574defe4648ca8d96d0857763980  ./GBM/cebola/resultados monte alto.xls
4a73f4cdf550a3dc76e2c95308bcf69b  ./GBM/cebola/resultados vista alegre.xls

Agora, preciso ordenar esta lista pelo hash. Porém eu gostaria, depois de 
ordenado, te ter uma listagem apenas com os arquivos que possuem o mesmo hash. 
Dá para fazer isso com facilidade usando o recurso de tabela dinâmica do excel. 

Mas... eu queria aprender a fazer em shell.

Alguma idéia?




reply via email to

[Prev in Thread] Current Thread [Next in Thread]