Jan 21 2009

Trouver les fichiers doubles avec un script shell

Publié par à 11:21 sous Linux




Ce script shell recherche les fichiers doubles dans un répertoire donné en comparant leur checksum (md5). C’est le contenu qui est comparé et qui est strictement identique, plutôt que le nom de fichier ou la date de création.
Ceci est utile, notamment pour suprimer les fichiers dupliqués de grande taille. L’option -size de la commande ‘Find’ peut être intéressante pour accélérer l’exécution et trouver les plus gros fichiers.
 

admin@fileserver$
find /usr/bin -type f -print0 |
xargs -0 -n1 md5sum |
sort -k 1,32 |
uniq -w 32 -d --all-repeated=separate |
sed -e 's/^[0-9a-f]*\ *//;'

/usr/bin/c2ph
/usr/bin/pstruct

/usr/bin/pgrep
/usr/bin/pkill

/usr/bin/perl
/usr/bin/perl5.8.8
/usr/bin/suidperl
...

 
Il est possible de l’exécuter sur des systèmes de fichiers Windows montés avec Samba.


No responses yet

Comments RSS

Leave a Reply