Ich versuche herauszufinden , ob Ridge Regression , LASSO , Principal Component Regression (PCR) oder Partial Least Squares (PLS) in einer Situation mit einer großen Anzahl von Variablen / Merkmalen ( ) und einer geringeren Anzahl von Stichproben ( ), und mein Ziel ist die Vorhersage.pppn<pn<pn n , meistens ;p>10np>10np>10n …
Ich versuche, eine Regression auf heteroskedastischen Daten durchzuführen, wobei ich versuche , die Fehlervarianzen sowie die Mittelwerte in Form eines linearen Modells vorherzusagen . Etwas wie das: y( x , t )ξ( x , t )y¯( x , t )σ( x , t )= y¯(x,t)+ξ(x,t),∼N(0,σ(x,t)),=y0+ax+bt,=σ0+cx+dt.y(x,t)=y¯(x,t)+ξ(x,t),ξ(x,t)∼N(0,σ(x,t)),y¯(x,t)=y0+ax+bt,σ(x,t)=σ0+cx+dt.\begin{align}\\ y\left(x,t\right) &= \bar{y}\left(x,t\right)+\xi\left(x,t\right),\\ \xi\left(x,t\right) &\sim …
Nachdem ich die Antwort doppelt transformiert hatte, erreichte ich eine starke lineare Beziehung zwischen meiner XXX und YY.Y Variablen. Das Modell war Y∼XY.∼XY\sim X aber ich habe es in verbessertR2von 0,19 auf 0,76.YX−−√∼X−−√YX∼X\sqrt{\frac{Y}{X}}\sim \sqrt{X}R2R2R^2 Offensichtlich habe ich mich in dieser Beziehung anständig operieren lassen. Kann jemand die Fallstricke diskutieren, die …
Permutationstests (auch Randomisierungstest, Re-Randomisierungstest oder exakter Test genannt) sind sehr nützlich und nützlich, wenn die zum Beispiel erforderliche Annahme einer Normalverteilung t-testnicht erfüllt ist und wenn die Transformation der Werte durch Rangfolge der Werte erfolgt Ein nicht parametrischer Test Mann-Whitney-U-testwürde dazu führen, dass mehr Informationen verloren gehen. Eine einzige Annahme, …
Ich habe einige Daten (158 Fälle), die aus einer Likert-Skala für 21 Fragebogenelemente abgeleitet wurden. Ich möchte / muss wirklich eine Regressionsanalyse durchführen, um zu sehen, welche Punkte auf dem Fragebogen die Antwort auf einen Gesamtpunkt vorhersagen (Zufriedenheit). Die Antworten sind nicht normalverteilt (laut KS-Tests) und ich habe sie in …
Ich bin noch ziemlich neu in verallgemeinerten linearen Modellen, und ich habe Probleme mit der Notation in den meisten GLM-Texten, die ich aufgegriffen habe. Gibt es äußerst beliebte GLM-Bücher, die sich besser lesen lassen?
Ich habe einige Daten, die zwischen 0 und 1 begrenzt sind. Ich habe das betaregPaket in R verwendet, um ein Regressionsmodell mit den begrenzten Daten als abhängige Variable anzupassen. Meine Frage ist: Wie interpretiere ich die Koeffizienten aus der Regression?
Aus Wikipedia Einflussreiche Beobachtungen sind Beobachtungen, die einen relativ großen Einfluss auf die Vorhersagen des Regressionsmodells haben. Aus Wikipedia Hebelpunkte sind die Beobachtungen, falls vorhanden, die bei extremen oder abweichenden Werten der unabhängigen Variablen gemacht wurden, so dass das angepasste Regressionsmodell aufgrund des Fehlens benachbarter Beobachtungen dieser bestimmten Beobachtung nahe …
Das R-Plot-Paket ggplot2 verfügt über eine großartige Funktion namens stat_smooth zum Plotten einer Regressionslinie (oder -kurve ) mit dem zugehörigen Konfidenzband. Es fällt mir jedoch schwer, genau herauszufinden, wie dieses Konfidenzband für jede Zeit der Regressionsgeraden (oder "Methode") erzeugt wird. Wie finde ich diese Informationen?
Ich versuche, Random Forest Regression zum Erlernen von Scikits zu verwenden. Das Problem ist, dass ich einen sehr hohen Testfehler erhalte: train MSE, 4.64, test MSE: 252.25. So sehen meine Daten aus: (blau: echte Daten, grün: vorhergesagt): Ich benutze 90% für das Training und 10% für den Test. Dies ist …
Ich wurde kürzlich von einem Kunden zu einer Bootstrap-Analyse eingeladen, da ein FDA-Gutachter sagte, dass die Regression der Fehler in Variablen ungültig sei, da beim Poolen von Daten von Sites die Analyse das Poolen von Daten von drei Sites beinhaltete, an denen zwei Sites einige Proben enthielten das Gleiche. HINTERGRUND …
Gibt es ein Standardverfahren (so dass man es als Referenz anführen könnte), um die Teilmenge der Datenpunkte aus einem größeren Pool mit der stärksten Korrelation (entlang nur zwei Dimensionen) auszuwählen? Angenommen, Sie haben 100 Datenpunkte. Sie möchten eine Teilmenge von 40 Punkten mit der größtmöglichen Korrelation entlang der X- und …
Ich denke an die angepassten R-Quadrat-Formeln, die vorgeschlagen werden von: Ezekiel (1930), von dem ich glaube, dass er derzeit in SPSS verwendet wird. R2a d j u s t e d= 1 -( N- 1 )( N- p - 1 )( 1 - R2)Reindjusted2=1-(N-1)(N-p-1)(1-R2)R^2_{\rm adjusted} = 1 - \frac{(N-1)}{(N-p-1)} (1-R^2) …
Ich arbeite mit einem Datensatz mit N rund 200.000. In Regressionen sehe ich sehr kleine Signifikanzwerte << 0.001, die mit sehr kleinen Effektgrößen verbunden sind, z. B. r = 0.028. Was ich gerne wissen würde, gibt es eine grundsätzliche Möglichkeit, eine angemessene Signifikanzschwelle in Bezug auf die Stichprobengröße zu bestimmen? …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.