Verwenden Sie dieses Tag für jede * themenbezogene * Frage, bei der (a) "R" entweder als kritischer Teil der Frage oder als erwartete Antwort enthält, und (b) nicht * nur * die Verwendung von "R" betrifft.
Diese Frage wurde von Stack Overflow migriert, da sie bei Cross Validated beantwortet werden kann. Vor 5 Jahren migriert . Ich habe eine Frage zur Parameterinterpretation für eine GLM mit einer gamma-verteilten abhängigen Variablen. Dies ist, was R für mein GLM mit einem Log-Link zurückgibt: Call: glm(formula = income ~ …
Ich habe ein Experiment mit wiederholten Messungen, bei dem die abhängige Variable ein Prozentsatz ist, und ich habe mehrere Faktoren als unabhängige Variablen. Ich würde gerne glmerdas R-Paket verwenden lme4, um es als logistisches Regressionsproblem zu behandeln (indem ich es spezifiziere family=binomial), da es dieses Setup direkt zu berücksichtigen scheint. …
Ich habe ein OLS-Regressionsmodell für einen Datensatz mit 5 unabhängigen Variablen ausgeführt. Die unabhängigen Variablen und die abhängige Variable sind beide stetig und stehen in linearer Beziehung zueinander. Der R-Platz ist ungefähr 99,3%. Aber wenn ich dasselbe mit einer zufälligen Gesamtstruktur in R ausführe, ist mein Ergebnis '% Var Explained: …
Ist es möglich, die Kosten einer Fehlklassifizierung im R-Paket randomForest zu kontrollieren ? In meiner eigenen Arbeit sind falsch negative Ergebnisse (z. B. das Fehlen einer Krankheit) weitaus kostspieliger als falsch positive Ergebnisse. Das Paket rpart ermöglicht es dem Benutzer, Fehlklassifizierungskosten zu kontrollieren, indem eine Verlustmatrix angegeben wird, um Fehlklassifizierungen …
Ich interessiere mich für Beispiele von Quellen (R-Code, R-Pakete, Bücher, Buchkapitel, Artikel, Links usw.), um statistische und mathematische Konzepte mit R zu lernen (es könnte auch mit anderen Sprachen sein, aber R ist mein Lieblingsgeschmack). Die Herausforderung besteht darin, dass das Erlernen des Materials von der Programmierung abhängt und nicht …
Ich habe kürzlich begonnen, Regressionsmischmodelle im Bayes'schen Rahmen unter Verwendung eines MCMC-Algorithmus (Funktion MCMCglmm in R) anzupassen. Ich glaube, ich habe verstanden, wie man die Konvergenz des Schätzprozesses diagnostiziert (Kurve, Geweke-Plot, Autokorrelation, posteriore Verteilung ...). Eines der Dinge, die mir im Bayes'schen Rahmen auffallen, ist, dass viel Aufwand für diese …
Ich mache einige Nachforschungen, stecke aber in der Analysephase fest (hätte meinen Statistikvorträgen mehr Aufmerksamkeit schenken sollen). Ich habe zwei gleichzeitige Signale gesammelt: die integrierte Durchflussrate für das Volumen und die Änderung der Brustausdehnung. Ich möchte die Signale vergleichen und letztendlich hoffen, die Lautstärke aus dem Brustexpansionssignal abzuleiten. Aber zuerst …
Ich finde es oft so, dass ich mit caretR mehrere verschiedene Vorhersagemodelle trainiere. Ich trainiere sie alle auf den gleichen Kreuzvalidierungsfalten mit caret::: createFoldsund wähle dann das beste Modell basierend auf kreuzvalidierten Fehlern. Die Medianvorhersage mehrerer Modelle übertrifft jedoch häufig das beste Einzelmodell in einem unabhängigen Testsatz. Ich denke darüber …
Angenommen, Sie analysieren einen riesigen Datensatz mit Milliarden von Beobachtungen pro Tag, wobei jede Beobachtung einige Tausend spärliche und möglicherweise redundante numerische und kategoriale Variablen enthält. Angenommen, es gibt ein Regressionsproblem, ein Problem der unausgeglichenen binären Klassifizierung und die Aufgabe, herauszufinden, welche Prädiktoren am wichtigsten sind. Mein Gedanke, wie ich …
Ich frage mich, wie genau die Beziehung zwischen partiellem R2R2R^2 und Koeffizienten in einem linearen Modell ist und ob ich nur einen oder beide verwenden sollte, um die Bedeutung und den Einfluss von Faktoren zu veranschaulichen. Soweit ich weiß, summaryerhalte ich mit Schätzungen der Koeffizienten und mit anovader Summe der …
Ich hatte immer den Eindruck, dass die Regression nur eine allgemeinere Form der ANOVA ist und die Ergebnisse identisch wären. In letzter Zeit habe ich jedoch sowohl eine Regression als auch eine ANOVA mit denselben Daten durchgeführt, und die Ergebnisse unterscheiden sich erheblich. Das heißt, im Regressionsmodell sind sowohl die …
Verschlossen . Diese Frage und ihre Antworten sind gesperrt, da die Frage nicht zum Thema gehört, aber von historischer Bedeutung ist. Derzeit werden keine neuen Antworten oder Interaktionen akzeptiert. Ich habe ein lineares Modell in R: erstellt mod = lm(train_y ~ train_x). Ich möchte ihm eine Liste von X übergeben …
Ich muss die inverse Matrix berechnen und habe die solveFunktion verwendet. Während es bei kleinen Matrizen gut funktioniert solve, ist es bei großen Matrizen tendenziell sehr langsam. Ich habe mich gefragt, ob es eine andere Funktion oder Kombination von Funktionen gibt (über SVD, QR, LU oder andere Zerlegungsfunktionen), die mir …
Ich habe mich gefragt, ob es möglich ist, einen sehr starken Korrelationskoeffizienten (z. B. 0,9 oder höher) mit einem hohen p-Wert (z. B. 0,25 oder höher) zu haben. Hier ist ein Beispiel für einen niedrigen Korrelationskoeffizienten mit einem hohen p-Wert: set.seed(10) y <- rnorm(100) x <- rnorm(100)+.1*y cor.test(x,y) cor = …
Ich möchte ein binäres logistisches Regressionsmodell im Kontext von Streaming-Daten (mehrdimensionale Zeitreihen) verwenden, um den Wert der abhängigen Variablen der Daten (dh der Zeile), die gerade angekommen sind, unter Berücksichtigung der bisherigen Beobachtungen vorherzusagen. Soweit mir bekannt ist, wird die logistische Regression traditionell für die postmortale Analyse verwendet, bei der …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.