Dies ist keine wirklich unixy Frage, aber auf jeden Fall würde ich empfehlen, etwas anderes als less
zum Anzeigen von CSV-Dateien zu verwenden. Es ist nicht wirklich das richtige Werkzeug. Versuchen Sie etwas wie R
, das eine gute Unterstützung für das Betrachten und ggf. Arbeiten mit CSV-Dateien bietet. Um beispielsweise 5 Zeilen einer CSV-Datei zu lesen, tun Sie dies
$ R
> read.csv("pheno.csv",nrows=5)
faid expid pid mid sex pheno
1 1420 NA12003 0 0 1 0
2 1420 NA12004 0 0 2 0
3 1420 NA10838 9 10 1 0
4 1420 NA12005 0 0 1 0
5 1420 NA12006 0 0 2 0
Sehen
> help(read.csv)
für Hilfe. Siehe auch
> help(write.csv)
zum Schreiben in eine Datei usw.
EDIT: Ich hatte zufällig eine CSV-Datei, die 1.1G ist und 934991 Zeilen lang ist.
$ time Rscript -e 'read.csv("GenomeWideSNP_6.na29.annot.csv", skip=500000, nrows=5, header=FALSE)'
Dies überspringt 500.000 Zeilen und liest 5 Zeilen. R benötigt 1 Minute, um dies zurückzugeben, und erreicht eine Auslastung von 620 MB (!). Es sieht so aus, als würde es die übersprungenen Zeilen in den Speicher lesen, obwohl dies keinen Sinn ergibt.
Das Fazit: Ich bin nicht wirklich ein R-Fan, aber für den Umgang mit kleinen bis mittleren Datenmengen, insbesondere wenn Sie statistische Analysen durchführen möchten, könnten Sie schlechter abschneiden als R. Eine Alternative ist Python und eine CSV-Verarbeitungsbibliothek.