Ich habe eine Datei mit zwei Spalten und 10 Millionen Zeilen. Die erste Spalte enthält viele wiederholte Werte, aber in Spalte 2 gibt es einen eindeutigen Wert. Ich möchte die wiederholten Zeilen entfernen und nur eine verwenden awk
. Hinweis: Die Datei ist nach Werten in Spalte 1 sortiert. Beispiel:
1.123 -4.0
2.234 -3.5
2.234 -3.1
2.234 -2.0
4.432 0.0
5.123 +0.2
8.654 +0.5
8.654 +0.8
8.654 +0.9
.
.
.
.
Erwartete Ausgabe
1.123 -4.0
2.234 -3.5
4.432 0.0
5.123 +0.2
8.654 +0.5
.
.
.
.
sort -buk1,1