Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

10
Wer sind Frequentisten?
Wir hatten bereits einen Thread, in dem gefragt wurde, wer Bayesianer sind und einer, ob Frequentisten Bayesianer sind , aber es gab keinen Thread, in dem direkt gefragt wurde, wer Frequentisten sind . Diese Frage wurde von @whuber als Kommentar zu diesem Thread gestellt und muss beantwortet werden. Existieren sie …

4
Auswahl zwischen LM und GLM für eine log-transformierte Antwortvariable
Ich versuche die Philosophie zu verstehen, die hinter der Verwendung eines generalisierten linearen Modells (GLM) gegenüber einem linearen Modell (LM) steckt. Ich habe unten einen Beispieldatensatz erstellt: Log( y) = x + εLog⁡(y)=X+ε\log(y) = x + \varepsilon Das Beispiel hat nicht den Fehler als Funktion der Größe vonyεε\varepsilonyyy , daher …

9
Empfehlung für erweiterte Statistikbücher
Auf dieser Website gibt es mehrere Themen mit Buchempfehlungen zu Einführungsstatistiken und maschinellem Lernen. Ich suche jedoch nach einem Text zu erweiterten Statistiken, der nach Priorität geordnet ist: maximale Wahrscheinlichkeit, verallgemeinerte lineare Modelle, Hauptkomponentenanalyse, nichtlineare Modelle . Ich habe versucht, statistische Modelle von AC Davison, aber ehrlich gesagt musste ich …




7
Welche Pseudo-
Ich habe SPSSfür ein logistisches Regressionsmodell ausgegeben. Die Ausgabe meldet zwei Maßnahmen für das Modell fit, Cox & Snellund Nagelkerke. Welche dieser Kennzahlen würden Sie als Faustregel als passend melden?R2R²R^² Oder welcher dieser Anpassungsindizes ist derjenige, über den normalerweise in Fachzeitschriften berichtet wird? Hintergrund: Bei der Regression wird versucht, das …



2
Grundlegende Frage zu Fisher Information Matrix und Beziehung zu hessischen und Standardfehlern
Ok, das ist eine ziemlich grundlegende Frage, aber ich bin ein bisschen verwirrt. In meiner Diplomarbeit schreibe ich: Die Standardfehler können durch Berechnung der Umkehrung der Quadratwurzel der diagonalen Elemente der (beobachteten) Fisher-Informationsmatrix ermittelt werden: sμ^,σ^2=1I(μ^,σ^2)−−−−−−√sμ^,σ^2=1I(μ^,σ^2)\begin{align*} s_{\hat{\mu},\hat{\sigma}^2}=\frac{1}{\sqrt{\mathbf{I}(\hat{\mu},\hat{\sigma}^2)}} \end{align*} Da der Optimierungsbefehl in R minimiert die (beobachtete) Fisher-Informationsmatrix durch Berechnung der …

9
Wie ergänzen sich R und Python in der Datenwissenschaft?
In vielen Tutorials oder Handbüchern scheint die Erzählung zu implizieren, dass R und Python als komplementäre Komponenten des Analyseprozesses nebeneinander existieren. Für mein ungeübtes Auge scheint es jedoch so, als ob beide Sprachen das Gleiche tun. Meine Frage ist also, ob es wirklich spezialisierte Nischen für die beiden Sprachen gibt …
54 r  python  software 


9
Übertreiben wir die Bedeutung der Modellannahme und -bewertung in einer Zeit, in der Analysen häufig von Laien durchgeführt werden?
Fazit : Je mehr ich über Statistik lerne, desto weniger vertraue ich veröffentlichten Artikeln in meinem Bereich. Ich glaube einfach, dass Forscher ihre Statistiken nicht gut genug machen. Ich bin sozusagen ein Laie. Ich bin in Biologie ausgebildet, aber ich habe keine formale Ausbildung in Statistik oder Mathematik. Ich mag …


3
Verwendung der Hauptkomponentenanalyse (PCA) zur Merkmalsauswahl
Ich bin neu in der Featureauswahl und habe mich gefragt, wie Sie PCA für die Featureauswahl verwenden würden. Berechnet PCA für jede Eingabevariable eine relative Bewertung, mit der Sie nichtinformative Eingabevariablen herausfiltern können? Grundsätzlich möchte ich in der Lage sein, die ursprünglichen Merkmale in den Daten nach Varianz oder Menge …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.