Als «csv» getaggte Fragen

Dateien, die Daten enthalten, werden in einer Tabelle angeordnet, häufig mit Kommas (daher durch Kommas getrennte Werte), um Spalten zu trennen. Zeilen werden durch Zeilenumbrüche getrennt (aber nicht alle Zeilenumbrüche sind Zeilentrennzeichen, da Felder so zitiert werden können, dass sie die Zeilenumbrüche des Trennzeichens enthalten. Verwenden Sie dieses Tag für vollwertige CSV-Daten, nicht den einfacheren Fall eines Datensatzes pro Zeile oder vollständig ohne Anführungszeichen (verwenden Sie csv-simple) für diese Art von Daten).



6
Entfernen Sie Zeilen aus einer Datei, abhängig von den Zeilen in einer anderen Datei
Die Datei file1.txt enthält Zeilen wie: /api/purchase/<hash>/index.html Beispielsweise: /api/purchase/12ab09f46/index.html Die Datei file2.csv enthält Zeilen wie: <hash>,timestamp,ip_address Beispielsweise: 12ab09f46,20150812235200,22.231.113.64 a77b3ff22,20150812235959,194.66.82.11 Ich möchte file2.csv filtern und alle Zeilen entfernen, in denen der Wert von Hash auch in file1.txt vorhanden ist. Das heißt: cat file1.txt | extract <hash> | sed '/<hash>/d' file2.csv oder …

2
Neuindizierung einer großen CSV-Datei
Ich habe die Antworten in diesem hilfreichen Thread durchgesehen , aber mein Problem scheint so unterschiedlich zu sein, dass mir (zumindest mit sed) keine gute Antwort einfällt . Ich habe eine große CSV-Datei (200+ GB) mit Zeilen, die wie folgt aussehen: <alphanumerical_identifier>,<number> wo <alphanumerical_identifier>ist über die gesamte Datei eindeutig. Ich …
11 files  sed  awk  csv 

3
Formatieren Sie die Ausgabe des Befehls 'ps' ohne Leerzeichen
Ich habe den folgenden psBefehl, um bestimmte Eigenschaften aller laufenden Prozesse zusammen mit einigen Eigenschaften abzurufen: ps --no-headers -exo "uname,ppid,pid,etime,%cpu,%mem,args" Ich möchte, dass es in CSV formatiert wird, damit ich es analysieren kann. Hinweis: Ich habe die Argumente am Ende gesetzt, um das Parsen zu vereinfachen. Ich glaube nicht, dass …
11 csv  ps 


4
Entfernen Sie nur die Kommas in doppelten Anführungszeichen
In einer Textdatei möchte ich ,(Kommas) und auch "(Anführungszeichen) entfernen ( nur wenn die doppelten Anführungszeichen durch Kommas getrennte Zahlen enthalten). 56,72,"12,34,54",x,y,"foo,a,b,bar" Erwartete Ausgabe 56,72,123454,x,y,"foo,a,b,bar" Hinweis: Ich zeige die obige Zeile nur als Beispiel. Meine Textdatei enthält viele Zeilen wie oben und die durch Kommas getrennten Zahlen in doppelten Anführungszeichen …


1
awk entfernt unerwartet Punkte aus der Zeichenfolge
Ich möchte eine Spalte (2. Platz) in eine .csvDatei einfügen und möchte, dass die Werte dieser Spalte Zeichenfolgen sind und in Anführungszeichen gesetzt werden. Der folgende Befehl fügt die Spalte hinzu, jedoch ohne Anführungszeichen: awk -F"," 'BEGIN { OFS = "," } {$2="2.4.0"; print}' test.csv > output.csv Der folgende Ansatz …
9 awk  csv 

1
So erhalten Sie Zeilen, deren n-te Spalte die m-te Spalte enthält
Ich habe eine CSV-Datei, die Domains und Webmails enthält, wie folgt: site1.com,mail.site1.com site2.com,testmail.com site3.com,mx.site3.com site4.com,smtp.site4.com site5.com,foomail.com site6.com,barmail.com site7.com,webmail.site7.com site8.com,01mx.site8.com site9.com,foobarmail.com site10.com,mx-smtp222.site10.com Ich möchte Zeilen erhalten, in denen die Webmails-Spalte die Domains-Spalte derselben Zeile enthält. Für das obige Beispiel sollte die Ausgabe sein: site1.com,mail.site1.com site3.com,mx.site3.com site4.com,smtp.site4.com site7.com,webmail.site7.com site8.com,01mx.site8.com site10.com,mx-smtp222.site10.com


4
Konvertieren Sie CSV in eine HTML-Tabelle
Ich habe eine Medical.csvDatei mit Zeilen im folgenden Format: field: 'participation.type', displayName: 'program_type', type: 'String',path:'participation' field: 'participation.program', displayName: 'program_name', type: 'String',path:'participation' Ich möchte ein schreiben Bash - Skript , es mit zu HTML - Tabelle zu konvertieren field, displayNameund typeals Header dynamisch. Die Csv2HtmlConverter.sh(Inspiriert von Antwort bei Konvertieren von CSV …

6
Wie kann ich tabulatorgetrennte Daten in durch Kommas getrennte Daten konvertieren?
Ich fordere eine Liste von ec2-Snapshots über das ec2-Befehlszeilentool von amazon an: ec2-describe-snapshots -H --hide-tags > snapshots.csv Die Daten sehen ungefähr so ​​aus: SnapshotId VolumeId StartTime OwnerId VolumeSize Description snap-00b66464 vol-b99a38d0 2012-01-05 5098939 160 my backup Wie kann ich die Daten abfangen, bevor ich sie umleitung, snapshots.csvund die folgenden Schritte …

7
Wie drucke ich alle Zeilen einer Datei mit doppelten Werten in einer bestimmten Spalte?
Bei einer Datei wie dieser: 1,768,12,46576457,7898 1,123,435,134,146 2,345,6756856,12312,1311 5,234,567465,12341,1341 1,3245,4356345,2442,13 9,423,2342,121,463 9,989,342,121,1212 Ich möchte alle Zeilen (im Bash-Terminal) so auflisten, dass der Wert in Spalte 1 mindestens zweimal erscheint (in Spalte 1). Das Ergebnis sollte sein 1,768,12,46576457,7898 1,123,435,134,146 1,3245,4356345,2442,13 9,423,2342,121,463 9,989,342,121,1212

3
awk, wenn sowohl Trennzeichen als auch Anführungszeichen für ein Feld verwendet werden
Ich habe eine Datei im folgenden Format: field1|field2|field3 field1|"field2|field2"|field3 Beachten Sie, dass die zweite Zeile doppelte Anführungszeichen enthält. Die Zeichenfolge in doppelten Anführungszeichen gehört zu Feld 2. Wie wird dies mit awk extrahiert? Ich habe ohne Ergebnisse gegoogelt. Ich habe es auch ohne Glück versucht FS='"| "|^"|"$' '{print $2}'
7 awk  csv 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.