Ich möchte die Korrelation zwischen einer kontinuierlichen (abhängigen Variablen) und einer kategorialen (nominal: Geschlecht, unabhängige Variable) Variablen finden. Fortlaufende Daten werden normalerweise nicht verteilt. Vorher hatte ich es mit dem Spearman's berechnet . Mir wurde jedoch gesagt, dass es nicht richtig ist.ρρ\rho Bei der Suche im Internet habe ich festgestellt, …
Ich weiß, dass diese Frage milliardenfach gestellt wurde, und bin daher nach einem Online-Blick fest davon überzeugt, dass die Korrelation zwischen zwei Variablen keine Kausalität impliziert. In einem meiner Statistikvorträge hatten wir heute einen Gastvortrag eines Physikers über die Bedeutung statistischer Methoden in der Physik. Er sagte eine erstaunliche Aussage: …
Wenn zwei Variablen eine Korrelation von 0 aufweisen, warum sind sie dann nicht unbedingt unabhängig? Sind nullkorrelierte Variablen unter bestimmten Umständen unabhängig? Wenn möglich, suche ich eine intuitive Erklärung, keine hochtechnische.
Angenommen, ich habe zwei eindimensionale Arrays, und . Jedes enthält 100 Datenpunkte. sind die tatsächlichen Daten und ist die Modellvorhersage. In diesem Fall wäre der Wert: In der Zwischenzeit wäre dies gleich dem Quadratwert des Korrelationskoeffizienten Wenn ich nun die beiden vertausche: sind die tatsächlichen Daten und ist die Modellvorhersage. …
Wie ist die Beziehung zwischen und in der folgenden Darstellung? Meiner Ansicht nach gibt es eine negative lineare Beziehung. Da wir jedoch viele Ausreißer haben, ist die Beziehung sehr schwach. Habe ich recht? Ich möchte lernen, wie wir Streudiagramme erklären können.XY.YYXXX
Ich habe verstanden, dass Random Forest und Extrem Randomized Trees sich dahingehend unterscheiden, dass die Aufteilung der Bäume im Random Forest deterministisch ist, wohingegen sie im Fall von Extrem Randomized Trees zufällig ist (genauer gesagt, die nächste Aufteilung ist die beste Aufteilung) unter zufälligen gleichmäßigen Aufteilungen in den ausgewählten Variablen …
Ich weiß, dass dies eine ziemlich spezifische RFrage ist, aber ich denke möglicherweise falsch über die erklärte Proportionsvarianz . Hier geht.R2R2R^2 Ich versuche das RPaket zu benutzen randomForest. Ich habe einige Trainingsdaten und Testdaten. Wenn ich ein zufälliges Gesamtstrukturmodell anpasse, randomForestkönnen Sie mit dieser Funktion neue Testdaten zum Testen eingeben. …
Mantels Test wird häufig in biologischen Studien verwendet , um die Korrelation zwischen der räumlichen Verteilung von Tieren (Position im Raum) und beispielsweise ihrer genetischen Verwandtschaft, Aggressionsrate oder einem anderen Attribut zu untersuchen. Viele gute Fachzeitschriften verwenden es ( PNAS, Tierverhalten, Molekulare Ökologie ... ). Ich habe einige Muster hergestellt, …
Kürzlich wurde mir klar, dass ein gemischtes Modell mit nur einem Subjekt als Zufallsfaktor und den anderen Faktoren als festen Faktoren einer ANOVA entspricht, wenn die Korrelationsstruktur des gemischten Modells auf zusammengesetzte Symmetrie eingestellt wird. Daher möchte ich wissen, was Verbindungssymmetrie im Kontext einer gemischten (dh aufgeteilten) ANOVA bedeutet, bestenfalls …
X und Y sind nicht korreliert (-.01); Wenn ich jedoch X in eine multiple Regression lege, die Y vorhersagt, sind neben drei (A, B, C) anderen (verwandten) Variablen auch X und zwei andere Variablen (A, B) signifikante Prädiktoren für Y. Beachten Sie, dass die beiden anderen ( A, B) Variablen …
Sehr geehrte Damen und Herren, mir ist etwas Merkwürdiges aufgefallen, das ich Ihnen nicht erklären kann. Zusammenfassend lässt sich sagen, dass der manuelle Ansatz zur Berechnung eines Konfidenzintervalls in einem logistischen Regressionsmodell und die R-Funktion confint()unterschiedliche Ergebnisse liefern. Ich habe die angewandte logistische Regression von Hosmer & Lemeshow (2. Auflage) …
Wie lautet die Formel für die Varianz des Produkts abhängiger Variablen? Bei unabhängigen Variablen ist die Formel einfach: var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2 {\rm var}(XY) = E(X^{2}Y^{2}) - E(XY)^{2} = {\rm var}(X){\rm var}(Y) + {\rm var}(X)E(Y)^2 + {\rm var}(Y)E(X)^2 Aber wie lautet die Formel für korrelierte Variablen? Wie finde ich übrigens die Korrelation anhand …
Ich verstehe, dass Korrelation keine Kausalität ist . Angenommen, wir erhalten eine hohe Korrelation zwischen zwei Variablen. Wie überprüfen Sie, ob diese Korrelation tatsächlich kausal bedingt ist? Oder können wir unter welchen Bedingungen genau experimentelle Daten verwenden, um einen Kausalzusammenhang zwischen zwei oder mehr Variablen herzuleiten?
Ich werde mein Problem mit einem Beispiel erklären. Angenommen, Sie möchten das Einkommen einer Person anhand einiger Attribute vorhersagen: {Alter, Geschlecht, Land, Region, Stadt}. Sie haben einen Trainingsdatensatz wie diesen train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) …
Ich versuche nur, eine Behauptung zu wiederholen , die in dem folgenden Artikel , Finden von korrelierten Biklustern aus Genexpressionsdaten , gemacht wurde: Proposition 4. Wenn . dann haben wir:XichJ= RichCTJXichJ=RichCJTX_{IJ}=R_{I}C^{T}_{J} ich. Wenn ein perfekter Bicluster mit additivem Modell ist, dann ist ein perfekter Bicluster mit Korrelation auf Spalten; ii. …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.