Ich habe eine große sortierte Datei mit Milliarden Zeilen variabler Länge. Angesichts einer neuen Zeile möchte ich wissen, welche Bytenummer sie erhalten würde, wenn sie in die sortierte Datei aufgenommen worden wäre.
Beispiel
a\n
c\n
d\n
f\n
g\n
Bei der Eingabe 'foo' würde ich die Ausgabe 9 erhalten.
Dies ist einfach zu bewerkstelligen, indem einfach die gesamte Datei durchgegangen wird. Da es sich jedoch um Milliarden von Zeilen mit variabler Länge handelt, wäre eine binäre Suche schneller durchzuführen.
Existiert ein solches Textverarbeitungswerkzeug bereits?
Bearbeiten:
Es funktioniert jetzt: https://gitlab.com/ole.tange/tangetools/blob/master/bsearch/bsearch