Mit Bash durch alle Verzeichnisse inklusive Unterverzeichnisse

  • Mir sind gestern noch ein paar Ideen gekommen


    1)

    Man könnte zunächst die Dateigrößen miteinander vergleichen. Dateien die gleiche Größen haben, dürften zwar nicht unbedingt gleich sein, aber immerhin hat man einige Dateien damit eliminiert. Im zweiten Schritt würde ich nen Checksum über die verbliebenen laufen lasen.


    2)

    eine ganz andere Idee könnte sein, dass man sich ein Filesystem/SAN/NAS schnappt, welches Dedublizieren kann. Dies würde zwar die doppelten Dateien nicht finden, aber es würde Platz sparen, obwohl man diese auf dem Medium speichert.

    Ob das überhaupt ne Lösung ist, kommt auf das Ziel an.

    Suche: Sun Ultra 45 | Dolch PAC 65

  • Ich finde die Idee mit dem 1, kbyte checksum sehr verführerisch ......

    Sollte ich ggf morgen mal mit ans umsetzen gehen ... :)

    Das heißt aber, dass es Dir nicht darum geht Dateien zu finden, die die geiche Inode besitzen (also über Hardlinks verknüpft) sondern es geht Dir darum Dateien mit gleichem Inhalt zu finden. Also Dubletten.

    Das hatte ich dann wohl doch falsch verstanden.


    obbi