Ich habe crontab Ereignisarchive zu .tar.gz irgendeinem Ordner alle N Stunden. Endlich habe ich eine Sammlung von .tar.gz- Dateien. Jetzt möchte ich duplizierende Archive entfernen (erstellt, während die Zieldateien unverändert bleiben). Wie kann ich das tun?
Ich habe versucht, einen Vergleich durchzuführen, indem ich Hashsum überprüft habe, aber tar.gz-Archive haben immer eine andere Summe:
altera@nuclight:~$ rm -rf *
altera@nuclight:~$ echo "Hello world" > file
altera@nuclight:~$ tar czf a1.tgz file
altera@nuclight:~$ tar czf a2.tgz file
altera@nuclight:~$ tar czf a3.tgz file
altera@nuclight:~$ tar czf a4.tgz file
altera@nuclight:~$ tar czf a5.tgz file
altera@nuclight:~$ ls
a1.tgz a2.tgz a3.tgz a4.tgz a5.tgz file
altera@nuclight:~$ md5sum *.tgz
e8587f4c381856af9278a6ef2a452b00 a1.tgz
2f44617fb164e66a74c5c4992637e7d4 a2.tgz
1a094b315e2d0891a0c5dafebae9718f a3.tgz
6c3642d2441397c24e4de5377b9e0a7e a4.tgz
7c0e9128ef47a9dbcda0dd008e34cd8d a5.tgz
altera@nuclight:~$