Als «text-processing» getaggte Fragen

Manipulation oder Prüfung von Text durch Programme, Skripte usw.

6
Filterung ungültiger utf8
Ich habe eine Textdatei mit unbekannter oder gemischter Codierung. Ich möchte die Zeilen sehen, die eine Byte-Sequenz enthalten, die nicht für UTF-8 gültig ist (indem ich die Textdatei in ein Programm weitergebe). Entsprechend möchte ich die Zeilen herausfiltern, die für UTF-8 gültig sind. Mit anderen Worten, ich suche .grep [notutf8] …




3
Wie kann ich die Codierung einer Textdatei testen? Ist sie gültig und was ist sie?
Ich habe mehrere .htmDateien, die ohne Warnung / Fehler in Gedit geöffnet werden. Wenn ich jedoch dieselben Dateien in öffne Jedit, werde ich vor ungültiger UTF-8-Codierung gewarnt ... Das HTML-Meta-Tag lautet "charset = ISO-8859-1". Jedit erlaubt eine Liste von Fallback-Codierungen und eine Liste von Codierungsautodetektoren (derzeit "BOM XML-PI"), sodass mein …

8
Wie konvertiere ich TXT nach PDF?
Ich möchte .txtDateien in konvertieren .pdf. Ich benutze das: ls | while read ONELINE; do convert -density 400 "$ONELINE" "$(echo "$ONELINE" | sed 's/.txt/.pdf/g')"; done Dies führt jedoch zu einem "Fehler" - wenn die Textdatei eine sehr lange Zeile enthält, wird sie nicht umgebrochen. Eingabetext PDF ausgeben - Außerdem wäre …

5
Letzte Zeile aus der Datei löschen
Ich benutze sed , um Zeilen mit einer bestimmten Position als schnell zu löschen sed '1d' sed '5d' Aber was ist, wenn ich die letzte Zeile der Datei löschen möchte und die Anzahl der Zeilen nicht weiß (ich weiß, dass ich das mit wcund mehreren anderen Tricks erreichen kann). Verwenden …

5
Umgebungsvariablen in einer Datei durch ihre tatsächlichen Werte ersetzen?
Gibt es eine einfache Möglichkeit, Umgebungsvariablen in einer Datei zu ersetzen / auszuwerten? Angenommen, ich habe eine Datei config.xml, die Folgendes enthält: <property> <name>instanceId</name> <value>$INSTANCE_ID</value> </property> <property> <name>rootPath</name> <value>/services/$SERVICE_NAME</value> </property> ...etc. Ich möchte $INSTANCE_IDin der Datei den Wert der INSTANCE_IDUmgebungsvariablen $SERVICE_NAMEdurch den Wert der SERVICE_NAMEenv var ersetzen . Ich weiß …





4
Grep vom Ende einer Datei bis zum Anfang
Ich habe eine Datei mit ca. 30.000.000 Zeilen (Radius Accounting) und muss die letzte Übereinstimmung eines bestimmten Musters finden. Der Befehl: tac accounting.log | grep $pattern gibt was ich brauche, ist aber zu langsam, da das OS erst die ganze Datei lesen und dann an die Pipe senden muss. Ich …



Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.