Ich nehme Dummy-Daten der Temperatur im Vergleich zu Eisverkäufen und kategorisiere sie mit K-Mitteln (n Cluster = 2), um 2 Kategorien zu unterscheiden (total Dummy). Jetzt mache ich eine Hauptkomponentenanalyse dieser Daten und mein Ziel ist es zu verstehen, was ich sehe. Ich weiß, dass das PCA-Ziel darin besteht, die …
In mehreren Kaggle-Wettbewerben basierte die Wertung auf "logloss". Dies bezieht sich auf einen Klassifizierungsfehler. Hier ist eine technische Antwort, aber ich suche nach einer intuitiven Antwort. Die Antworten auf diese Frage zur Mahalanobis-Entfernung haben mir sehr gut gefallen , aber PCA ist kein logarithmischer Verlust. Ich kann den Wert verwenden, …
Es gibt eine Fülle bekannter Ressourcen, die Ratschläge zur Datenvisualisierung geben. (ZB Tufte, Stephen Few et al. , Nathan Yau .) Aber an welche Bereiche könnte man sich wenden, um Antworten auf Fragen wie diese zu erhalten: Ist die Tortendiagrammkritik in der Praxis relevant? Können Menschen die lineare Skalenlänge so …
In meinem Bereich besteht die übliche Methode zum Zeichnen gepaarter Daten aus einer Reihe von dünn abfallenden Liniensegmenten, die mit dem Median und dem CI des Medians für die beiden Gruppen überlagert werden: Diese Art von Plot wird jedoch viel schwieriger zu lesen, da die Anzahl der Datenpunkte sehr groß …
Ich habe Probleme beim Interpretieren von Interaktionsdiagrammen, wenn eine Interaktion zwischen den beiden unabhängigen Variablen besteht. Die folgenden Grafiken stammen von dieser Site: Hier sind und die unabhängigen Variablen und ist die abhängige Variable.B D V.EINAAB.BBD V.DVDV Frage: Es gibt eine Wechselwirkung und einen Haupteffekt von , aber keinen Haupteffekt …
Ich arbeite also mit logistischen Regressionsmodellen in R. Obwohl ich noch neu in der Statistik bin, habe ich das Gefühl, dass ich inzwischen ein gewisses Verständnis für Regressionsmodelle habe, aber es gibt immer noch etwas, das mich stört: Wenn Sie sich das verknüpfte Bild ansehen, sehen Sie die Zusammenfassung der …
Ich habe eine Frage zur Interpretation der Koeffizienten einer Wechselwirkung zwischen kontinuierlicher und kategorialer Variable. Hier ist mein Modell: model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), data=base_708) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 21.4836 2.0698 10.380 < 2e-16 *** lg_hag 8.5691 3.7688 2.274 0.02334 * raceblack -8.4715 1.7482 -4.846 1.61e-06 *** racemexican -3.0483 1.7073 …
Angenommen, ich habe eine Stichprobe von Häufigkeiten von 4 möglichen Ereignissen: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 und ich habe die erwarteten Wahrscheinlichkeiten, dass meine Ereignisse eintreten: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Mit der Summe der beobachteten …
Ich habe sowohl eine SVD-Zerlegung als auch eine mehrdimensionale Skalierung einer 6-dimensionalen Datenmatrix durchgeführt, um die Struktur der Daten besser zu verstehen. Leider sind alle Singularwerte in derselben Größenordnung, was bedeutet, dass die Dimensionalität der Daten tatsächlich 6 beträgt. Ich möchte jedoch die Werte der Singularvektoren interpretieren können. Zum Beispiel …
In Rkann ich mit der ncvTestFunktion des carPakets einen Breusch-Pagan-Test auf Heteroskedastizität durchführen . Ein Breusch-Pagan-Test ist eine Art Chi-Quadrat-Test. Wie interpretiere ich diese Ergebnisse: > require(car) > set.seed(100) > x1 = runif(100, -1, 1) > x2 = runif(100, -1, 1) > ncvTest(lm(x1 ~ x2)) Non-constant Variance Score Test Variance …
Ich habe Schwierigkeiten, einige Ergebnisse zu interpretieren. Ich mache eine hierarchisch verwandte Regression mit ecoreg. Wenn ich den Code eingebe, erhalte ich eine Ausgabe mit Quotenverhältnissen, Konfidenzverhältnissen und einer 2x maximierten Log-Wahrscheinlichkeit. Ich verstehe jedoch nicht vollständig, wie die 2x maximierte Protokollwahrscheinlichkeit zu interpretieren ist. Soweit ich weiß, wird die …
Ich suche sowohl eine 1) mechanische als auch eine 2) intuitive Erklärung dafür, wie die Auswirkungen einzelner Variablen bestimmt werden, indem andere Variablen konstant gehalten werden. Was genau bedeutet es in einem Beispiel mit Umfragedaten zu sagen: "Bei konstantem Alter, Geschlecht und Einkommen ist der Effekt der Bildung ___" Mein …
Quantile Regression (QR) soll manchmal unterschiedliche Beziehungen zwischen Variablen bei unterschiedlichen Quantilen der Verteilung aufzeigen. ZB Le Cook et al. "Über den Mittelwert hinaus denken: Ein praktischer Leitfaden für die Verwendung quantiler Regressionsmethoden für die Forschung im Gesundheitswesen" impliziert, dass die QR ermöglicht, dass die Beziehungen zwischen den interessierenden Ergebnissen …
Ich habe Fragen zu parametrischen und nicht parametrischen Testunterscheidungen durchsucht, und es scheint, dass sich alle Fragen auf einen sehr spezifischen Test, ein Datenproblem oder eine technische Unterscheidung konzentrieren. Ich bin nicht an der Frage des Testens von Annahmen (nicht; stattdessen prüfen) oder an der Frage der Leistung oder der …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.