Für eine Lösung, die frei von fummeligen externen Abhängigkeiten * ist, gibt es jetzt readxl
:
Das readxl-Paket erleichtert das Abrufen von Daten aus Excel in R. Im Vergleich zu vielen vorhandenen Paketen (z. B. gdata, xlsx, xlsReadWrite) weist readxl keine externen Abhängigkeiten auf, sodass die Installation und Verwendung auf allen Betriebssystemen einfach ist. Es wurde entwickelt, um mit tabellarischen Daten zu arbeiten, die in einem einzigen Blatt gespeichert sind.
Readxl unterstützt sowohl das ältere XLS-Format als auch das moderne XML-basierte XLSX-Format. Die Unterstützung von .xls wird durch die Bibliothek libxls C ermöglicht, die viele der Komplexitäten des zugrunde liegenden Binärformats abstrahiert. Zum Parsen von .xlsx verwenden wir die RapidXML C ++ - Bibliothek.
Es kann wie folgt installiert werden:
install.packages("readxl") # CRAN version
oder
devtools::install_github("hadley/readxl") # development version
Verwendung
library(readxl)
# read_excel reads both xls and xlsx files
read_excel("my-old-spreadsheet.xls")
read_excel("my-new-spreadsheet.xlsx")
# Specify sheet with a number or name
read_excel("my-spreadsheet.xls", sheet = "data")
read_excel("my-spreadsheet.xls", sheet = 2)
# If NAs are represented by something other than blank cells,
# set the na argument
read_excel("my-spreadsheet.xls", na = "NA")
* Nicht unbedingt wahr, es erfordert das Rcpp
Paket , für das wiederum Rtools (für Windows) oder Xcode (für OSX) erforderlich sind, die Abhängigkeiten außerhalb von R sind. Sie müssen jedoch nicht mit Pfaden usw. herumspielen Vorteil gegenüber Java- und Perl-Abhängigkeiten.
Update Es gibt jetzt das Rexcel- Paket. Dies verspricht, Excel-Formatierungen, -Funktionen und viele andere Arten von Informationen aus der Excel-Datei in R zu erhalten.
.csv
.