Ich habe eine Datei mit rund Millionen Zeilen. In den Zeilen habe ich ein Feld genannt transactionid
, das sich wiederholende Werte hat. Was ich tun muss, ist, sie deutlich zu zählen.
Unabhängig davon, wie oft ein Wert wiederholt wird, sollte er nur einmal gezählt werden.
... No matter of how many times a value is repeated, it should be counted as 1. ...
cat <file_name> | awk -F"|" '{if ((substr($2,0,8)=='20120110')) print $28}' | sort -u | wc -l
Die If-Klausel war für eine weitere Überprüfung des Datums, wie es offensichtlich scheint :)