TLDR
Die ursprüngliche Frage war unklar und lautete, dass das OP lediglich eine eindeutige Version des Inhalts einer Datei wünschte. Das ist unten gezeigt. In der seitdem aktualisierten Form der Frage gibt das OP nun an, dass es lediglich wissen möchte, ob der Inhalt der Datei eindeutig ist oder nicht.
Testen Sie, ob der Inhalt der Datei eindeutig ist oder nicht
Sie können einfach verwenden sort
, um zu überprüfen, ob eine Datei eindeutig ist oder Duplikate wie folgt enthält:
$ sort -uC input.txt && echo "unique" || echo "duplicates"
Beispiel
Angenommen, ich habe diese beiden Dateien:
Beispieldatei duplizieren
$ cat dup_input.txt
This is a thread 139737522087680
This is a thread 139737513694976
This is a thread 139737505302272
This is a thread 139737312270080
This is a thread 139737203164928
This is a thread 139737194772224
This is a thread 139737186379520
eindeutige Beispieldatei
$ cat uniq_input.txt
A
B
C
D
Wenn wir nun diese Dateien analysieren, können wir feststellen, ob sie eindeutig sind oder Duplikate enthalten:
Testduplikatdatei
$ sort -uC dup_input.txt && echo "unique" || echo "duplicates"
duplicates
eindeutige Datei testen
$ sort -uC uniq_input.txt && echo "unique" || echo "duplicates"
unique
Originalfrage (eindeutiger Inhalt der Datei)
Kann mit nur gemacht werden sort
:
$ sort -u input.txt
This is a thread 139737186379520
This is a thread 139737194772224
This is a thread 139737203164928
This is a thread 139737312270080
This is a thread 139737505302272
This is a thread 139737513694976
This is a thread 139737522087680