Ich bin ziemlich neu in diesem Bereich mit Binomialdatentests, musste aber einen durchführen, und jetzt bin ich nicht sicher, wie ich das Ergebnis interpretieren soll. Die y-Variable, die Antwortvariable, ist binomisch und die erklärenden Faktoren sind stetig. Folgendes habe ich bei der Zusammenfassung des Ergebnisses erhalten: glm(formula = leaves.presence ~ …
Ich versuche, ein Polynom zweiter Ordnung zu erstellen, das zu einigen meiner Daten passt. Angenommen, ich zeichne diese Übereinstimmung mit ggplot(): ggplot(data, aes(foo, bar)) + geom_point() + geom_smooth(method="lm", formula=y~poly(x, 2)) Ich bekomme: Eine Passung zweiter Ordnung funktioniert also ganz gut. Ich berechne es mit R: summary(lm(data$bar ~ poly(data$foo, 2))) Und …
X und Y sind nicht korreliert (-.01); Wenn ich jedoch X in eine multiple Regression lege, die Y vorhersagt, sind neben drei (A, B, C) anderen (verwandten) Variablen auch X und zwei andere Variablen (A, B) signifikante Prädiktoren für Y. Beachten Sie, dass die beiden anderen ( A, B) Variablen …
Meine Fragen Was ist der intuitive Grund für die Rotation von Faktoren in der Faktorenanalyse (oder von Komponenten in der PCA)? Mein Verständnis ist, dass es offensichtlich schwierig ist, die Komponenten zu unterscheiden, wenn Variablen in den obersten Komponenten (oder Faktoren) fast gleich geladen sind. In diesem Fall könnte man …
Ich weiß, dass es viele Materialien gibt, die den p-Wert erklären. Das Konzept ist jedoch ohne weitere Klarstellung nicht leicht festzuhalten. Hier ist die Definition von p-Wert aus Wikipedia: Der p-Wert ist die Wahrscheinlichkeit, eine Teststatistik zu erhalten, die mindestens so extrem ist wie die tatsächlich beobachtete, unter der Annahme, …
Wikipedia erklärt: Bei einem Datensatz ist der Mittelwert die Summe der Werte geteilt durch die Anzahl der Werte. Diese Definition entspricht jedoch dem, was ich "Durchschnitt" nenne (zumindest erinnere ich mich daran, dass ich dies gelernt habe). Noch einmal zitiert Wikipedia: Es gibt andere statistische Kennzahlen, die Stichproben verwenden, die …
Oft bin ich auf informelle Warnungen vor "Datenschnüffeln" gestoßen (hier ist ein amüsantes Beispiel ), und ich glaube, ich habe eine intuitive Vorstellung davon, was das ungefähr bedeutet und warum es ein Problem sein könnte. Andererseits scheint die "explorative Datenanalyse" ein absolut seriöses Verfahren in der Statistik zu sein, zumindest …
Wenn ich richtig verstehe, ist ein Konfidenzintervall eines Parameters ein Intervall, das mit einer Methode erstellt wurde, die Intervalle liefert, die den wahren Wert für einen bestimmten Anteil von Stichproben enthalten. Das "Vertrauen" bezieht sich also eher auf die Methode als auf das Intervall, das ich aus einer bestimmten Stichprobe …
Ich bin auf dieses nette Tutorial gestoßen: Ein Handbuch für statistische Analysen mit R. Kapitel 13. Hauptkomponentenanalyse: Der olympische Siebenkampf zur Durchführung von PCA in R-Sprache. Ich verstehe die Interpretation von Abbildung 13.3 nicht: Ich zeichne also den ersten Eigenvektor gegen den zweiten Eigenvektor. Was bedeutet das? Angenommen, der dem …
Ich bin etwas neu in der Verwendung der logistischen Regression und ein bisschen verwirrt von einer Diskrepanz zwischen meinen Interpretationen der folgenden Werte, die ich für gleich gehalten hätte: potenzierte Beta-Werte vorhergesagte Wahrscheinlichkeit des Ergebnisses anhand von Beta-Werten. Hier ist eine vereinfachte Version des von mir verwendeten Modells, bei dem …
Ich bin ziemlich neu in der Statistik und brauche deine Hilfe. Ich habe eine kleine Auswahl wie folgt: H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 Ich habe den Shapiro-Wilk-Test mit R durchgeführt: shapiro.test(precisionH4U$H4U) und ich habe folgendes Ergebnis erhalten: W = 0.9502, p-value = 0.6921 Wenn ich …
Ich habe einen maschinellen Lernwettbewerb durchgeführt, bei dem RMSLE (Root Mean Squared Logarithmic Error) verwendet wird, um die Leistung zu bewerten und den Verkaufspreis einer Gerätekategorie vorherzusagen. Das Problem ist, dass ich nicht sicher bin, wie ich den Erfolg meines Endergebnisses interpretieren soll. Wenn ich zum Beispiel einen Effektivwert von …
Ich hoffe, diese Frage stört Sie alle nicht, aber ich brauche Hilfe bei der Interpretation der Ausgabe für ein lineares Mischeffektmodell, das ich in R lernen wollte. Ich bin neu in der Längsschnittdatenanalyse und der linearen Mischeffektregression. Ich habe ein Modell, das ich mit Wochen als Zeitprädiktor ausstattete, und als …
Ich bin gerade auf diese Arbeit gestoßen , in der beschrieben wird, wie die Wiederholbarkeit (auch bekannt als Zuverlässigkeit, auch bekannt als Intraclass-Korrelation) einer Messung über Mixed-Effects-Modellierung berechnet wird. Der R-Code wäre: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = …
Für statistische und maschinelle Lernmodelle gibt es mehrere Interpretierbarkeitsebenen: 1) den Algorithmus als Ganzes, 2) Teile des Algorithmus im Allgemeinen, 3) Teile des Algorithmus für bestimmte Eingaben, und diese drei Ebenen sind in jeweils zwei Teile unterteilt. eine für das Training und eine für die Funktionsbewertung. Die letzten beiden Teile …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.