Ist es schneller, nach langen oder kurzen Suchbegriffen zu suchen? Oder wirkt es sich überhaupt auf die Geschwindigkeit aus? Mit anderen Worten, sollten Sie die Suchbegriffe so genau wie möglich gestalten?
Es gibt mehr als 100 000 Dateien und jede Datei enthält zwischen 20 und mehr als 5000 Datenzeilen. Normalerweise wird der grep verwendet, um nur eine Instanz des Suchbegriffs zu finden.
Nehmen wir an, der Suchbegriff lautet SEARCHTERM
und wird in einer Reihe wie dieser stehen:
NAD+DP+1234567890:92++UNIQUE+NAME+SEARCHTERM++12345+FI'
Ist es schneller, nach "SEARCH" oder "SEARCHTERM" zu suchen? Nehmen wir an, dass es uns in diesem Fall egal ist, ob wir Übereinstimmungen auch in anderen nicht verwandten Zeilen finden.
So mache ich es derzeit:
grep NAD+DP 123* | grep SEARCHTERM
Aber ich finde es immer noch ziemlich langsam. Normalerweise dauert es ungefähr 3-5 Minuten, um die Daten zu finden, selbst wenn ich den groben Dateinamen kenne, der den Bereich auf ungefähr 10 000 Dateien begrenzt.
Würde ein längerer oder kürzerer Suchbegriff helfen? Soweit ich weiß, sucht grep nach "Wortblöcken" einer bestimmten Länge?