Welches Buch ist empfehlenswert, um gleichzeitig mit R Statistik zu lernen?


50

Bücher zum Statistiklernen mit R

Was genau ist das Buch, nach dem ich suche?

Was ich suche, ist ein Buch, in dem Sie Statistiken lernen, während Sie R verwenden, um praktische Erfahrungen zu sammeln, und das Ihnen letztendlich dabei hilft, R gemeinsam zu lernen. Ich habe auf amazon viele Bücher gesehen, die dies versuchen, aber nicht mit R. Beispiele sind Minitab und SAS.

Sind das R-Buch und das statistische Rechnen eine Option? - Immer noch nicht beantwortet .

Das R-Buch und das statistische Rechnen: Eine Einführung in die Datenanalyse mit S-Plus erscheint sinnvoll, aber eine Lesermeinung hier wäre hilfreich und willkommen.

In welcher Beziehung steht das Buch zu Statistikkursen?

Um noch genauer zu sein, wonach ich gesucht habe, betrachten Sie diese beiden Kurse, in denen Sie Ergebnisse zu Statistiken von einem Mathematik-Institut an der Universität lernen. Ich bin zurzeit Student:

Intermediate Statistics und Probability & Statistics , das heißt, ich suche in einem Buch einen normalen Statistikkurs für Fortgeschrittene, aber nicht nur für Tafel und Papier, bei dem Sie lernen und stattdessen R verwenden. Das bedeutet auch, dass ich nach einem Buch suche, das davon ausgeht, dass ich von Anfang an Statistiken lernen möchte.

Dieses Buch richtet sich auch an Forscher.

Ich bin auch ein Softwareentwickler, aber ich schätze, die aktuelle Situation, in der Sie mit Bergen von Daten zu tun haben und Statistiken lernen möchten, um weiterhin Code zu schreiben, der so gut wie auf viele andere Bereiche anwendbar ist.

Das heißt, ich bin nicht daran interessiert, jedes einzelne Detail jeder einzelnen Eigenschaft für jede einzelne Kurve zu lernen, sondern vielmehr daran, Daten für meinen Forschungsbereich zu verstehen, obwohl es mir nichts ausmacht, wenn das Buch diesbezüglich ausführlicher vorgehen möchte .

Als letzte Motivation lese ich wissenschaftliche Artikel in verschiedenen Communities, die Ergebnisse basierend auf statistischen Schlussfolgerungen vorbringen, obwohl es keinen lesbaren Beweis dafür gibt, ob die statistischen Annahmen / Einschränkungen verletzt werden oder nicht.

Ein Buch, in dem es nicht um Statistik geht, stellt nicht sicher, dass ich mich nicht mit dieser Praxis befasse. Aus diesem Grund habe ich mich für ein Buch entschieden, das einem Statistikkurs mit R ähnelt, anstatt mit einem Überblicksbuch herumzuspielen.

Verwandte Fragen in Cross Validated.

Antworten und Feedback zu dieser Frage.

@ Julie

Vorgeschlagene Bücher sind nur wenige, auf die ich bereits gestoßen bin, aber ein Beispiel, das mir leider nicht zusagt:

Einführungsstatistik mit R , Verwenden von R für Einführungsstatistik , Statistik: Eine Einführung mit R sind nur einige der Bücher, die ich bereits auf amazon gelesen habe. Es geht jedoch um eine Statistikübersicht oder um Annahmen, die statistische Vorkenntnisse erfordern. Das Problem mit Übersichtsbüchern besteht hauptsächlich darin, die Aufmerksamkeit nicht auf die Annahmen und Einschränkungen zu lenken und genügend Erklärungen zu liefern, damit die Informationen einen Sinn ergeben.

Wenn Sie der Meinung sind, dass es kein Buch gibt, das auch für diese Anforderung geeignet ist, oder wenn Sie das R-Buch oder das Statistische Rechnen in Betracht ziehen: Eine Einführung in die Datenanalyse mit S-Plus würde dazu passen, würde ich diese Art der Antwort auch begrüßen.

@Christopher Aden

Die Einführung in die Wahrscheinlichkeitsrechnung und Statistik mit R scheint die am nächsten liegende, aber immer noch allgemeine zu sein, nach der ich gesucht habe.

Was ich erwartet hatte, war ein Buch wie David S. Moore, The Basics of Statistics, weil:

  • Es deckt alle statistischen Themen ab.
  • Es verwendet zwei Tools, miniTab und andere, um praktische Informationen zu der soeben erläuterten Methode zu erhalten.
  • Es werden sehr viele Annahmen und Einschränkungen hervorgehoben. Dies ist sehr wichtig für einen Forscher, der keinen detaillierten Statistikkurs belegt hat und Statistiken verwenden möchte. Kaum ein Überblicksbuch wird darüber berichten, was für Forscher gefährlich ist.
    • Das Inhaltsverzeichnis des Buches finden Sie hier . Beachten Sie, dass der Schwerpunkt auf Statistik und die Verwendung von Werkzeugen liegt, um das Verständnis zu verbessern, und den Schüler dazu zu bringen, zu lernen, wie Werkzeuge verwendet werden, um die Statistik nach dem Lernen auf einfachere Weise durchzuführen. Es geht nicht um das Tool, sondern um Statistiken!

Ich möchte genau das gleiche, aber mit R.

@ Gregory Demin

Es verwendet R als pädagogische Beispiele, setzt voraus, dass Sie Statistiken lernen möchten, und das Beste ist, dass es Open Source ist. Leider werden weder ANOVA noch ANCOVA oder fortgeschrittenere Fächer behandelt.

@Peter Ellis

Guter Vorschlag für ein Lehrbuch, das behandelt, was in dieser Frage gewünscht wird.

Bücher in der Fragestellung, die die Frage beantworten.

@ Peter Ellis und @ Gregory Demin.

Sammlung von R-Büchern bei Amazon

Amazon Diskussion über R Bücher für verschiedene Studenten Hintergrund finden Sie hier .

Video Lectures unterrichten Statistik mit R

Google Tech Talk aus dem Jahr 2007 , dass auch diese Frage und deckt mehr über Data Mining motivierte statt Statistiken , aber zusammen mit R hier .

Antworten:


15

Ich denke, ein Grund, warum es so schwer zu beantworten ist, ist, dass R so leistungsfähig und flexibel ist, dass eine echte Einführung in die R-Programmierung weit über das hinausgeht, was normalerweise für eine Einführung in die Statistik erforderlich ist. In den Büchern, in denen Statistiken mit MiniTab, JMP oder SPSS unterrichtet werden, wird mit der Software relativ unkompliziert verfahren, was R in Bezug auf Datenmanipulation, Simulationen, kundenspezifische Funktionen usw. nur knapp an der Oberfläche abschneidet.

Trotzdem denke ich, dass Wilcox ' Moderne Statistik für die Sozial- und Verhaltenswissenschaften: Eine praktische Einführung (2012) ein brillantes neues Buch ist. Es setzt keine statistischen Kenntnisse voraus und führt Sie von Grund auf durch eine Vielzahl moderner robuster Techniken. und setzt nicht viel mehr R-Wissen voraus als die Fähigkeit, es zu öffnen und einen Datensatz zu laden. Es deckt auch viele der klassischen Techniken ab, einschließlich ANOVA (im OP erwähnt).

Ich würde dieses Buch als das Äquivalent zu den Büchern sehen, die Statistiken und ein Statistikpaket wie SPSS gleichzeitig einführen. Sie lernen jedoch nicht, R zu programmieren, sondern nur, wie moderne statistische Analysen damit durchgeführt werden. Dabei liegt der Schwerpunkt auf robusten Techniken, die die bekannten Probleme der klassischen Analyse lösen, die bei den meisten anderen Ansätzen zum Lehren von Statistik nicht zum Tragen kommen.

Die drei Probleme mit klassischen Methoden, die in diesem Buch von Anfang an besonders angesprochen werden, sind Stichproben aus schwerfälligen Distributionen; Schiefe; und Heteroskedastizität.

Wilcox verwendet R, weil "R im Hinblick auf die Ausnutzung moderner statistischer Techniken klar dominiert. Bei der Analyse von Daten handelt es sich zweifellos um die wichtigste Softwareentwicklung des letzten Vierteljahrhunderts. Und es ist kostenlos. Obwohl klassische Methoden grundlegende Mängel aufweisen Es wird nicht empfohlen, sie vollständig aufzugeben. Es werden daher Abbildungen zur Anwendung von Standardmethoden mit R bereitgestellt. Von besonderer Bedeutung ist hierbei, dass zusätzlich Abbildungen zur Anwendung moderner Methoden mit über 900 R bereitgestellt werden Funktionen, die für dieses Buch geschrieben wurden. "

Dieses Buch ist so hervorragend, dass ich nach dem Kauf eines Werkexemplars mein eigenes Exemplar zu Hause gekauft habe.

Die Kapitelüberschriften sind:

  1. numerische und grafische Zusammenfassungen von Daten;
  2. Wahrscheinlichkeit und verwandte Konzepte;
  3. Stichprobenverteilungen und Konfidenzintervalle;
  4. Hypothesentest;
  5. Regression und Korrelation;
  6. Bootstrap-Methoden;
  7. Vergleichen von zwei unabhängigen Gruppen;
  8. Vergleichen von zwei abhängigen Gruppen;
  9. Einweg-ANOVA;
  10. Zweiwege- und Dreiwegeausführungen;
  11. Vergleichen von mehr als zwei abhängigen Gruppen;
  12. mehrfache Vergleiche;
  13. einige multivariate Methoden;
  14. robuste Regression und Assoziationsmaßnahmen;
  15. grundlegende Methoden zur Analyse kategorialer Daten;

Weitere Bearbeitung - Nachdem ich mir das Beispiel von David Moore angesehen habe, was Sie suchen, glaube ich wirklich, dass Wilcox 'Buch die Anforderungen erfüllt.


1
Vielen Dank Ich freue mich über eine weitere Referenz, die auch als druckbares Band erhältlich ist. Ich werde den Hauptbeitrag später so bearbeiten, dass er Ihre Referenz enthält, wenn dies bis dahin noch niemand tut! Wirklich sehr geschätzt. Nur um zu bestätigen, du meinst, es lehrt dich, die Theorie zu zeichnen, die erwähnt wird? Das ist mehr als gut für mich! Bitte bestätigen.
Oeufcoque Penteano

Ich bin mir nicht ganz sicher, was Sie mit "Plotten der Theorie" meinen - aber es macht mit Sicherheit ausgiebigen Gebrauch von Plots und verfügt über den R-Code, um alle Theorien, die es abdeckt (sowohl die statistische Folgerung als auch das Plotten), auszuführen. Wilcox bietet auch ein eigenes Paket von Funktionen oder Referenzen für die in den letzten Jahrzehnten entwickelten innovativen robusten Ansätze an. Jede Technik wird mit Beispielen einschließlich Code geliefert. Ich habe die Antwort bearbeitet, um Kapitelüberschriften einzuschließen.
Peter Ellis

Ja, du hast alles richtig gemacht! Die Codestücke, die mir helfen, die ganze Theorie über R zu machen, wären sehr willkommen und notwendig für das, worüber ich nachdenke. Vielen Dank für die Bereitstellung der Liste! Ich brauchte auch ein Buch, in dem es um Bootstrap ging. Ich bestelle dieses Buch bereits. Wird den Hauptbeitrag bald bearbeiten.
Oeufcoque Penteano

Ich stöbere bereits in diesem Buch. +500 auf diesen Vorschlag, genau das, wonach ich gesucht habe: Ein dickes Band voller Informationen über Statistiken und die entsprechende Funktion, um es auf R zu verwenden (was ja kostenlos und Open Source ist!). Es ist sehr günstig für die Größe dieses Buches und seine Einzigartigkeit. Fürchte dich nicht davor, für Verhaltenswissenschaften zu sein. Ich benutze es, obwohl ich ein CS-Student bin. Ich fand, dass die Bücher mit den Verhaltensstatistiken für mich noch hilfreicher sind als die mit den Statistiken, um zu verstehen, was vor sich geht. Ich sage nicht, dass eine reine Statistik nutzlos ist, du brauchst eine. Ich habe Paul Meyer (1965) benutzt.
Oeufcoque Penteano


4

@ Julies Beitrag von Verzanis Buch ist eine wirklich gute Wahl für jemanden, der weder R- noch Statistik-Erfahrung hat. Es ist sowohl für das R als auch für die Statistik weich genug, dass es von der Abteilung für Politikwissenschaft an der UC Davis verwendet wird, und diese Studenten haben weder Programmierunterricht noch Mathematik auf höherem Niveau. Seine Arbeit ist über sein CRAN-Paket simpleR verfügbar .
Da Sie einen Informatik-Hintergrund haben, brauchen Sie meiner Meinung nach keine besonders sorgfältige Einführung in R. Ich gehe davon aus, dass Sie über gute Kenntnisse in Bezug auf Datenstrukturen, Umfang und Gründe für die Verwendung eines Debuggers verfügen. Eine sehr rechenintensive Sichtweise auf R (mehr, als Sie vielleicht in einem statistischen Programmierkurs in einer Statistikabteilung zu sehen bekommen) finden Sie in Norm Matloffs The Art of R Programming. Um zu sehen, ob es Sie interessiert, hat Matloff auf seiner Website einen sehr groben Entwurf für eine Vordruckversion zur Verfügung . Wenn Sie seinen Stil mögen, würde ich empfehlen, die fertige Kopie zu greifen. Er ist CS-Professor und schreibt das Buch eher für ein CS-Publikum als für ein Statistikpublikum.
G. Jay Kerns (ein häufiges Plakat hier) hat auch ein Buch online verfügbar genannt Einführung in Wahrscheinlichkeitsrechnung und Statistik Mit R . Ich persönlich halte es für einen wunderbaren Dienst, die Eingeweide von R. vorzustellen.
Ich stelle fest, dass Ihre Frage darauf abzielt, Antworten auf einen CS-Hauptfach zu erhalten, aber lesen Sie bitte auch dieses Thema durch: Welches Buch würden Sie nicht-statistischen Wissenschaftlern empfehlen?


1
Ich glaube, die Einführung in die Wahrscheinlichkeitsrechnung und Statistik mit R ist die am nächsten liegende, aber immer noch nicht die, nach der ich suche. Ich bearbeite die Frage in einer Sekunde, um eine Referenz dessen zu geben, wonach ich suche, benutze aber leider miniTab anstelle von R. Die Kunst der R - Programmierung scheint sich mehr mit R als mit der Tatsache des Lernens von Statistiken zu beschäftigen (korrigieren Sie mich, wenn ich es bin) falsch), und das vorige Buch befasst mich erneut mit der Frage, ob ich in Bezug auf Statistiken rigoros genug bin, um Annahmen über den statistischen Hintergrund zu treffen, der mir leider fehlt. Ich werde auch die wichtigsten Punkte zusammenfassen.
Oeufcoque Penteano

Sie haben Recht mit TAoRP - es wird mehr Wert auf die Programmierung gelegt als auf das Erlernen von Statistiken. Ihre Frage verwirrt mich allerdings ein wenig. Wenn Sie nicht mit dem Erlernen der mathematischen Statistik beginnen möchten, müssen Sie einige Annahmen treffen und diese - zumindest kurz - auf den Glauben übertragen. Sie möchten ein Buch, das Statistiken einführt, Beispiele in R enthält und Annahmen nicht überschlägt? Die meisten Intro-Bücher bieten eine gewisse Intuition für Modellierungsannahmen, können jedoch die Logik nicht formalisieren. Dazu musst du wahrscheinlich ein Mathe-Statistik-Buch lesen.
Christopher Aden

Bitte lesen Sie das Buch, das ich gerade bei meiner letzten Bearbeitung der Frage erwähnt habe. Es macht genau das, was ich wollte. Tatsächlich kam die Frage aus dem Lesen von Stücken dieses Buches. Ich möchte dasselbe, aber mit R. habe ich auch in Aufzählungszeichen hervorgehoben, was in dem Buch aus dem riesigen Motivationsanteil für diejenigen, die noch nie auf das Buch gestoßen sind, so wichtig ist. Ich hoffe es ist jetzt klar. Das Inhaltsverzeichnis des Buches kann auch hier gesehen werden whfreeman.com/Catalog/product/...
Oeufcoque Penteano

3

Ich fand dieses Buch von großem Nutzen, aber es setzt einige Kenntnisse grundlegender statistischer Begriffe wie p-Wert, ANOVA usw. voraus.

Dieses Buch bietet eine viel sanftere Einführung in statistische Konzepte selbst ...


+1. Verzanis Buch ist eine sehr sanfte Einführung und auch aus seinem CRAN-Paket erhältlich. Dalgaards Buch ist auch sehr schön und er spricht mit Sicherheit als Experte und ist kein Fremder in der R-Welt!
Christopher Aden

@ChristopherAden - Welches Buch würden Sie empfehlen, um eine solide Grundlage für das konzeptionelle Nachdenken über Statistik zu schaffen , ohne sich (wirklich) mit der Mathematik selbst zu befassen?
Julie

@ Julie, was ist dein Hauptfach? Eines Tages bekam ich von einem Sozialprofessor ein Buch aus dem Jahr 1979 über Statistik für Soziologiestudenten. Manchmal sind sie hilfreicher, obwohl ein Professor, der auf amazon erwähnt wurde, kommentiert, dass sie dazu neigen, mehr Fehler zu machen, insbesondere bei Formeln, die für Professoren gefährlich sind, die nicht zu sehr in die Statistik
einfließen

Julie: Das ist definitiv eine Frage, die ich untersuchen werde, um bessere Empfehlungen zu geben. Ich habe aus Statistik gelernt: Die Kunst und Wissenschaft des Lernens aus Daten von Agresti und Franklin. Ich fand den anwendungsbasierten Ansatz großartig. Es bietet nicht die vom OP gewünschte 50: 50-Aufteilung zwischen Statistik und R, weshalb ich mich nicht darum gekümmert habe, es zu erwähnen. Ich bin aber immer noch ein Neuling in der Statistik, also nimm meine Aufnahmen mit einem Körnchen Salz.
Christopher Aden

1
Hallo Julie. Es wäre schön, wenn Sie in Ihrer Antwort für jedes Buch ein vollständiges Zitat angeben könnten. :)
Kardinal

1

Ein gutes Buch wird über die Adelaide University produziert und ist kostenlos online und als Hardcopy-Kauf erhältlich.

Statistik lernen mit R

Es ist in seiner Struktur sehr gut aufgeschlüsselt und deckt eine Einführung in R sowie eine grundlegende Einführung in die Statistik ab, bevor es weiterführende Themen behandelt.

Es gibt eine sehr umfangreiche Liste von Büchern auf der R-Website, die als Referenz dienen. Sie haben die Titel jedoch noch nicht gelesen. Sie werden aktualisiert, wenn ich fortfahre.

https://www.r-project.org/doc/bib/R-books.html


0

Learning Statistics Using R von Randall E. Schumacker erscheint im Januar 2014 bei SAGE Publications. Es enthält das gesamte Material in der Buchung.


3
Es ist in Ordnung, wenn die Leute uns über ihre eigene Arbeit informieren. Wir schätzen dieses Wissen aus erster Hand sehr. Es ist jedoch mehr als eine gute Idee, die Verbindung zu einer Empfehlung anzuerkennen: Sie verleiht der Empfehlung mehr Glaubwürdigkeit und verleiht Ihnen auch den Kredit, den Sie verdienen :-). Vielleicht könnten Sie diese Gelegenheit nutzen, Randy, um Ihre Antwort zu erweitern, Ihre Urheberschaft anzuerkennen und mehr darüber zu sagen, warum Ihr Buch für die in der Frage genannten Zwecke eine gute Wahl wäre. Und herzlich willkommen auf unserer Seite!
Whuber
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.