Welche R-Pakete finden Sie in Ihrer täglichen Arbeit am nützlichsten?


28

Doppelter Thread: Ich habe gerade die neueste Version von R installiert. Welche Pakete sollte ich erhalten?

Was sind die R- Pakete, die Sie sich bei Ihrer täglichen Arbeit mit Daten nicht vorstellen können? Bitte listen Sie sowohl allgemeine als auch spezifische Tools auf.

UPDATE: Stand 24.10.10 ggplot2scheint der Gewinner mit 7 Stimmen zu sein.

Andere Pakete, von denen mehr als eines erwähnt wird, sind:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

Vielen Dank für Ihre Antworten!


1
Sehr subjektive Frage: Diese Frage kann nicht beantwortet werden und ist nicht für eine QS-Site geeignet.
Egon Willighagen

3
Sollte wohl Community-Wiki sein; nützliche Frage hier, hat aber keine definitive Antwort.
Shane

2
@ Shane: Guter Punkt. gerührt. @ Egon: ja subjektiv. Aber wenn die Antworten von sachkundigen Leuten kommen, macht mir eine Dosis Subjektivität nichts aus. Ich habe vor kurzem angefangen, R zu lernen, und einige Dutzend müssen installiert werden, um es zu erkunden. Ich stelle jedoch fest, dass es Tools gibt, die ich unabhängig von der jeweiligen Aufgabe viel häufiger verwende.
Radek

Es wäre interessant, wenn StackExchange eine Methode zum Verknüpfen von Community-Wiki-Beiträgen zwischen Websites unterstützen könnte. Ich wette, diese Frage wurde bei Stackoverflow gestellt, und ich denke auch, dass die statistische Analyse einige Leute anziehen kann, die SO normalerweise nicht besuchen würden.
Sharpie

@Sharpie: Es gab einige interessante SO-Posts wie stackoverflow.com/questions/1295955/… oder stackoverflow.com/questions/1535021/…, die sich jedoch nicht auf Pakete konzentrieren. und ich stimme zu, die Verknüpfung von Community-Wiki könnte wirklich nützlich sein.
Radek

Antworten:




8

Ich benutze das Paket xtable . Das Paket xtable wandelt die von R erstellten Tabellen (insbesondere die Tabellen mit den anova-Ergebnissen) in LaTeX-Tabellen um, die in einen Artikel aufgenommen werden sollen.



8

ggplot2 - zweifellos die beste Visualisierung für R.

RMySQL / RSQLite / RODBC - zum Verbinden mit einer Datenbank

sqldf - manipuliert data.frames mit SQL-Abfragen

Hmisc / rms - Pakete von Frank Harrell mit praktischen Zusatzfunktionen und nützlichen Funktionen für Regressionsanalysen.

GenABEL - schönes Paket für genomweite Assoziationsstudien

Rcmdr - eine anständige Benutzeroberfläche für R, wenn Sie eine benötigen.

Schauen Sie sich auch CRANtastic an - dieser Link enthält eine Liste der beliebtesten R-Pakete. Viele, die ganz oben auf der Liste stehen, wurden bereits erwähnt


8

data.table ist jetzt mein Favorit! Freuen Sie sich sehr auf die neue Version mit der mehr Wunschliste implementiert.



6

Für mich persönlich verwende ich die drei folgenden Pakete, die alle aus dem großartigen Omega Project for Statistical Computing stammen (ich behaupte nicht, ein Experte zu sein, aber für meine Zwecke sind sie sehr einfach zu verwenden):

  • RCurl : Es gibt viele Optionen, die den Zugriff auf Websites ermöglichen, bei denen die Standardfunktionen in Base R meines Erachtens Probleme bereiten . Es ist eine R-Schnittstelle zur libcurl-Bibliothek, die den zusätzlichen Vorteil hat, dass eine ganze Community außerhalb von R sie entwickelt. Auch bei CRAN erhältlich .

  • XML : Es ist sehr verzeihend, fehlerhaftes XML / HTML zu analysieren. Es ist eine R-Schnittstelle zur libxml2-Bibliothek und hat erneut den zusätzlichen Vorteil, dass eine ganze Community außerhalb von R sie entwickelt. Auch auf CRAN verfügbar .

  • RJSONIO : Ermöglicht es, den von einem json-Aufruf zurückgegebenen Text zu analysieren und zur weiteren Analyse in einer Listenstruktur zu organisieren. Der Konkurrent dieses Pakets ist rjson, aber dieser hat den Vorteil, dass er schnell vektorisiert und durch S3 / S4 leicht erweiterbar ist und skalierbar für große Datenmengen.

6

Mit Sweave können Sie R-Code in ein LaTeX-Dokument einbetten. Die Ergebnisse der Ausführung des Codes und optional des Quellcodes werden Teil des endgültigen Dokuments.

Anstatt beispielsweise ein von R erstelltes Bild in eine LaTeX-Datei einzufügen, können Sie den R- Code in die Datei einfügen und alles an einem Ort aufbewahren.


4
Nur ein Hinweis für alle, die mit der reproduzierbaren Forschung mit R beginnen möchten. Ich würde Ihnen raten, sich das neue Paket knitranstelle von Sweave anzusehen . Es ist im Grunde auf Steroiden Sweave. Es ist genauso einfach, wenn nicht sogar einfacher zu lernen und weitaus flexibler.
Christoph_J


4

Ich finde Gitter zusammen mit dem Begleitbuch "Gitter: Multivariate Datenvisualisierung mit R" von Deepayan Sarkar von unschätzbarem Wert.


4

Wenn Sie Vorhersagemodelle erstellen, ist Caret ein Glücksfall. Insbesondere in Kombination mit dem Multicore- Paket sind einige erstaunliche Dinge möglich.


4

Täglich muss das nützlichste Paket "fremd" sein, das Funktionen zum Lesen und Schreiben von Daten für andere Statistikpakete, z. B. Stata, SPSS, Minitab, SAS usw., enthält. In einem Bereich zu arbeiten, in dem R nicht alltäglich ist, bedeutet dies ist ein sehr wichtiges Paket.


3

ich benutze

auto, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, umgestalten, RODBC, TeachingDemos, XML.

viel.


3

Ich könnte nicht leben ohne:

  • Gitter für Grafiken
  • xlsx oder XLConnect zum Lesen von Excel-Dateien
  • rtf , um Berichte im rtf-Format zu erstellen (ich würde Sword oder R2wd bevorzugen, aber ich kann statconn bei der Arbeit nicht installieren; ich werde es sicherlich bald mit odfWeave versuchen .)
  • nlme und lme4 für gemischte modelle
  • ff für die Arbeit mit großen Arrays

2

RODBC für den Zugriff auf Daten aus Datenbanken, sqldf für die Ausführung einfacher SQL-Abfragen für Datenrahmen (obwohl ich mich dazu zwinge, native R-Befehle zu verwenden) sowie ggplot2 und plyr



2

Wir verwenden meistens:

  • ggplot - für Diagramme
  • Statistiken
  • e1071 - für SVMs

Vielleicht möchten Sie auch Kernlab und Caret auf SVMs überprüfen. Sie sind interessante (nicht unbedingt bessere) Alternativen.
Zach


2

Für mich verwende ich Kernlab für das Kernel-basierte Machine Learning Lab und e1071 für SVM und ggplot2 für Grafiken


2

Ich benutze ggplot2, vegan und forme ziemlich oft um.



2

RColorBrewer wurde hier nicht erwähnt, ich verwende es oft zum Plotten, wenn ich Farbschemata benötige


2

Ich bin ein großer Fan von RCPP, wenn ich eine schnelle for-Schleife oder nicht sehr R-konforme Behandlungen benötige. Es ist sehr gut im R-Eco-System implementiert, kann Matrix / Sparse-Matrix ohne Konvertierung als Argumente in einer Funktion empfangen.

Die C ++ - Syntax ist einfach, wenn Sie einfache Dinge tun (was oft mein Fall ist).

Wirklich, Sie müssen kein Paketersteller sein, um diese großartige Bibliothek zu brauchen.

Habe ich gesagt, C ++ ist sehr schnell?


2

Die Pakete doParallel und foreach haben mir das Leben so erleichtert, dass ich meinen Code parallelisieren und auf einer rechneroptimierten Instanz auf Amazon EC2 ausführen konnte ! Ich benutze sie sehr oft. Ohne die von Louis Aslett herausgegebenen RStudio AMIs wäre das nicht möglich gewesen . Zum Schluss muss ich noch das stringr- Paket erwähnen , das das Arbeiten mit Streichern zu einem Spaziergang im Park macht. Verwenden Sie es in jeder Text-Mining-Anwendung. Außerdem benutze ich knitr sehr häufig, um qualitativ hochwertige Berichte über meine Arbeit zu erstellen. Vielen Dank für dieses erstaunliche Paket Yihui Xie!


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.