Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

3
Was ist der Unterschied zwischen dem AIC und der C-Statistik (AUC) für die Modellanpassung?
Akaike Information Criterion (AIC) und die c-Statistik (Fläche unter der ROC-Kurve) sind zwei Messgrößen für die logistische Regression. Es fällt mir schwer zu erklären, was passiert, wenn die Ergebnisse der beiden Maßnahmen nicht konsistent sind. Ich denke, sie messen etwas unterschiedliche Aspekte der Modellanpassung, aber was sind diese spezifischen Aspekte? …
29 logistic  roc  aic  auc 


1
Beste Methoden zur Faktorextraktion in der Faktoranalyse
SPSS bietet verschiedene Methoden zur Faktorextraktion an: Hauptkomponenten (die überhaupt keine Faktorenanalyse sind) Ungewichtete kleinste Quadrate Verallgemeinerte kleinste Quadrate Maximale Wahrscheinlichkeit Hauptachse Alpha Factoring Image Factoring Wenn Sie die erste Methode ignorieren, bei der es sich nicht um eine Faktoranalyse (sondern um eine Hauptkomponentenanalyse, PCA) handelt, welche dieser Methoden ist …

3
Interpretation einfacher Vorhersagen zu Odds Ratios in der logistischen Regression
Ich bin etwas neu in der Verwendung der logistischen Regression und ein bisschen verwirrt von einer Diskrepanz zwischen meinen Interpretationen der folgenden Werte, die ich für gleich gehalten hätte: potenzierte Beta-Werte vorhergesagte Wahrscheinlichkeit des Ergebnisses anhand von Beta-Werten. Hier ist eine vereinfachte Version des von mir verwendeten Modells, bei dem …

1
Unterschiede zwischen einem statistischen Modell und einem Wahrscheinlichkeitsmodell?
Die angewandte Wahrscheinlichkeit ist ein wichtiger Zweig der Wahrscheinlichkeit, einschließlich der rechnerischen Wahrscheinlichkeit. Da die Statistik nach meinem Verständnis die Wahrscheinlichkeitstheorie verwendet, um Modelle für den Umgang mit Daten zu erstellen, frage ich mich, was der wesentliche Unterschied zwischen dem statistischen Modell und dem Wahrscheinlichkeitsmodell ist. Wahrscheinlichkeitsmodell benötigt keine realen …




3
Mit welchem ​​Test kann ich Steigungen aus zwei oder mehr Regressionsmodellen vergleichen?
Ich möchte den Unterschied in der Reaktion zweier Variablen auf einen Prädiktor testen. Hier ist ein minimal reproduzierbares Beispiel. library(nlme) ## gls is used in the application; lm would suffice for this example m.set <- gls(Sepal.Length ~ Petal.Width, data = iris, subset = Species == "setosa") m.vir <- gls(Sepal.Length ~ …

3
Wie unterscheidet sich die Poisson-Verteilung von der Normalverteilung?
Ich habe einen Vektor mit einer Poisson-Verteilung wie folgt generiert: x = rpois(1000,10) Wenn ich ein Histogramm mit mache hist(x), sieht die Verteilung wie eine bekannte glockenförmige Normalverteilung aus. Ein Kolmogorov-Smirnoff-Test zeigt jedoch, ks.test(x, 'pnorm',10,3)dass sich die Verteilung aufgrund des sehr geringen pWerts erheblich von einer Normalverteilung unterscheidet . Meine …


2
Berechnen Sie die Übergangsmatrix (Markov) in R
Gibt es in R (eine eingebaute Funktion) eine Möglichkeit, die Übergangsmatrix für eine Markov-Kette aus einer Reihe von Beobachtungen zu berechnen? Nehmen Sie zum Beispiel einen Datensatz wie den folgenden und berechnen Sie die Übergangsmatrix erster Ordnung? dat<-data.frame(replicate(20,sample(c("A", "B", "C","D"), size = 100, replace=TRUE)))
29 r  markov-process 


3
Eine gute Gibbs-Sampling-Tutorials und Referenzen
Ich möchte lernen, wie Gibbs Sampling funktioniert, und suche nach einem guten Basis- bis Zwischenpapier. Ich habe einen Informatikhintergrund und grundlegende statistische Kenntnisse. Hat jemand gutes Material gelesen? wo hast du es gelernt? Vielen Dank
29 references  gibbs 

2
Anpassen eines ARIMAX-Modells mit Regularisierung oder Bestrafung (z. B. mit Lasso, elastischem Netz oder Kammregression)
Ich verwende die auto.arima () -Funktion im Vorhersagepaket , um ARMAX-Modelle mit einer Vielzahl von Kovariaten zu kombinieren. Ich habe jedoch oft eine große Anzahl von Variablen zur Auswahl und erhalte normalerweise ein endgültiges Modell, das mit einer Teilmenge von ihnen funktioniert. Ich mag keine Ad-hoc-Techniken für die Variablenauswahl, weil …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.