Ich habe eine sehr lange Reihe von URLs ohne Trennzeichen im gleichen Format wie unten:
http://example.comhttp://example.nethttp://example.orghttp://etc...
Ich möchte, dass jede URL in einer neuen Zeile steht. Ich habe versucht, dies zu tun, indem ich alle Instanzen von "http: //" durch "\ nhttp: //" mit sed ersetzt habe
sed 's_http://_\nhttp://_g' urls.txt
Es tritt jedoch ein Segmentierungsfehler auf (Speicherverletzung). Ich kann nur vermuten, dass die schiere Größe der Datei (über 100 GB) dazu führt, dass sed ein bestimmtes Limit überschreitet.
Ich könnte die Datei zur Verarbeitung in mehrere kleinere Dateien aufteilen, aber alle Instanzen von "http: //" müssten intakt bleiben.
Gibt es einen besseren Weg, dies zu tun?