Die erwartete quadratische Abweichung einer Zufallsvariablen von ihrem Mittelwert; oder die durchschnittliche quadratische Abweichung der Daten über ihren Mittelwert.
... vorausgesetzt, ich kann ihr Wissen über die Varianz auf intuitive Weise erweitern ( "Varianz" intuitiv verstehen ) oder indem ich sage: Es ist der durchschnittliche Abstand der Datenwerte vom Mittelwert - und da die Varianz quadratisch ist Einheiten nehmen wir die Quadratwurzel, um die Einheiten gleich zu halten, und …
Ich habe mich gefragt, was der Unterschied zwischen der Varianz und der Standardabweichung ist. Wenn Sie die beiden Werte berechnen, ist es klar, dass Sie die Standardabweichung aus der Varianz erhalten, aber was bedeutet das für die Verteilung, die Sie beobachten? Warum brauchen Sie eigentlich eine Standardabweichung?
Wie vergleichen sich verschiedene Kreuzvalidierungsmethoden in Bezug auf Modellvarianz und Verzerrung? Meine Frage ist zum Teil durch diesen Thread motiviert: Optimale Anzahl von Falten bei der fachen Kreuzvalidierung: Ist ein ausschließlicher Lebenslauf immer die beste Wahl? KKK. Die dortige Antwort legt nahe, dass Modelle, die mit einer einmaligen Kreuzvalidierung erlernt …
Was ist der sauberste und einfachste Weg, um jemandem das Konzept der Varianz zu erklären? Was bedeutet es intuitiv? Wenn man dies seinem Kind erklären soll, wie würde man dann vorgehen? Es ist ein Konzept, das ich nur schwer artikulieren kann - insbesondere, wenn ich Varianz mit Risiko in Beziehung …
Ich beginne mit der Verwendung von dabble glmnetmit LASSO Regression , wo mein Ergebnis von Interesse dichotomous ist. Ich habe unten einen kleinen nachgebildeten Datenrahmen erstellt: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- …
Für eine Simulationsstudie muss ich Zufallsvariablen generieren, die eine vorab festgelegte (Populations-) Korrelation zu einer vorhandenen Variablen .Y.YY Ich sah in die RPakete copulaund CDVineder Zufall multivariate Verteilungen mit einer bestimmten Abhängigkeitsstruktur erzeugen kann. Es ist jedoch nicht möglich, eine der resultierenden Variablen an eine vorhandene Variable zu binden. Anregungen …
Die Formel zur Berechnung der Varianz hat im Nenner :(n−1)(n−1)(n-1) s2=∑Ni=1(xi−x¯)2n−1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} Ich habe mich immer gefragt, warum. Das Lesen und Anschauen einiger guter Videos über das "Warum" von scheint jedoch ein guter unverzerrter Schätzer der Populationsvarianz zu sein. Während die Populationsvarianz unterschätzt und überschätzt.n ( …
Ist es (immer) wahr, dass Var(∑i=1mXi)=∑i=1mVar(Xi)?Var(∑i=1mXi)=∑i=1mVar(Xi)?\mathrm{Var}\left(\sum\limits_{i=1}^m{X_i}\right) = \sum\limits_{i=1}^m{\mathrm{Var}(X_i)} \>?
Ich habe nicht verstanden, warum es Nund N-1während der Berechnung der Populationsvarianz gibt. Wann verwenden wir Nund wann verwenden wir N-1? Klicken Sie hier für eine größere Version Wenn die Population sehr groß ist, gibt es keinen Unterschied zwischen N und N-1, aber es sagt nichts darüber aus, warum es …
Wenn die Annahme der Homogenität der Varianz erfüllt ist, scheinen die Ergebnisse eines nach Welch eingestellten t-Tests und eines Standard-t-Tests ungefähr gleich zu sein. Warum nicht einfach immer das von Welch eingestellte t verwenden?
Ich suche nach einer intuitiven Erklärung des Kompromisses zwischen Bias und Varianz, sowohl im Allgemeinen als auch im Speziellen im Kontext der linearen Regression.
Ich frage mich, ob es einen Unterschied in der Interpretation macht, ob nur die abhängigen, sowohl die abhängigen als auch die unabhängigen Variablen oder nur die unabhängigen Variablen log-transformiert werden. Betrachten Sie den Fall von log(DV) = Intercept + B1*IV + Error Ich kann die IV als prozentuale Erhöhung interpretieren, …
Wir kennen die Antwort für zwei unabhängige Variablen: V a r (XY.) = E( X2Y.2) - ( E( XY.) )2= V a r ( X) V ein R ( Y) + V a r ( X) ( E( Y) )2+ V a r ( Y) ( E( X) )2Var(XY)=E(X2Y2)−(E(XY))2=Var(X)Var(Y)+Var(X)(E(Y))2+Var(Y)(E(X))2 {\rm …
Die Kappa- Statistik ( ) wurde 1960 von Cohen [1] eingeführt, um die Übereinstimmung zwischen zwei Bewertern zu messen. Seine Varianz war jedoch seit geraumer Zeit eine Quelle von Widersprüchen.κκ\kappa Meine Frage ist, welches die beste Varianzberechnung für große Stichproben ist. Ich neige dazu zu glauben, dass das von Fleiss …
Was ist der Unterschied zwischen einer Population und einer Stichprobe? Welche gemeinsamen Variablen und Statistiken werden für jede verwendet und in welcher Beziehung stehen diese zueinander?
TL, DR: Es sieht so aus, als ob entgegen häufig wiederholter Ratschläge die einmalige Kreuzvalidierung (LOO-CV) - das heißt, derKKK fache CV mitKKK (die Anzahl der Falten) ist gleichNNN (die Anzahl) der Trainingsbeobachtungen) - liefert Schätzungen des Generalisierungsfehlers, diefür jedes K am wenigsten variabel sind, und nicht die variabelsten, wobei …
Bei der einfachen linearen Regression ist , wobei . Ich habe den Schätzer abgeleitet: wobei und die Beispielmittel für und .y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + uu∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2)β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , x¯x¯\bar{x}y¯y¯\bar{y}xxxyyy Jetzt möchte ich die …
Der Nenner des (unverzerrten) Varianzschätzers ist n−1n−1n-1 da nnn Beobachtungen vorliegen und nur ein Parameter geschätzt wird. V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} Aus dem gleichen Grund frage ich mich, warum der Nenner der Kovarianz nicht n−2n−2n-2 wenn zwei Parameter geschätzt werden. Cov(X,Y)=∑ni=1(Xi−X¯¯¯¯)(Yi−Y¯¯¯¯)n−1Cov(X,Y)=∑i=1n(Xi−X¯)(Yi−Y¯)n−1 \mathbb{Cov}\left(X, Y\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)\left(Y_{i}-\overline{Y}\right)}{n-1}
Es wäre wünschenswert, wenn die folgenden Beispiele gegeben werden könnten: Eine Verteilung mit unendlichem Mittelwert und unendlicher Varianz. Eine Verteilung mit unendlicher mittlerer und endlicher Varianz. Eine Verteilung mit endlichem Mittelwert und unendlicher Varianz. Eine Verteilung mit endlichem Mittelwert und endlicher Varianz. Es kommt von mir, dass ich diese ungewohnten …
Großes Bild: Ich versuche zu verstehen, wie das Erhöhen der Stichprobengröße die Leistung eines Experiments erhöht. Die Folien meines Dozenten erläutern dies mit einem Bild von 2 Normalverteilungen, eine für die Nullhypothese und eine für die Alternativhypothese und einer Entscheidungsschwelle c dazwischen. Sie argumentieren, dass eine zunehmende Stichprobengröße die Varianz …
Sehr geehrte Damen und Herren, mir ist etwas Merkwürdiges aufgefallen, das ich Ihnen nicht erklären kann. Zusammenfassend lässt sich sagen, dass der manuelle Ansatz zur Berechnung eines Konfidenzintervalls in einem logistischen Regressionsmodell und die R-Funktion confint()unterschiedliche Ergebnisse liefern. Ich habe die angewandte logistische Regression von Hosmer & Lemeshow (2. Auflage) …
Ich stelle mir vor, je größer ein Koeffizient für eine Variable ist, desto größer ist die Fähigkeit des Modells, in dieser Dimension zu "schwingen", was eine größere Möglichkeit bietet, Rauschen anzupassen. Obwohl ich denke, dass ich ein vernünftiges Gespür für die Beziehung zwischen der Varianz im Modell und großen Koeffizienten …
Was ist der Unterschied zwischen endlicher und unendlicher Varianz? Meine Statistikkenntnisse sind eher grundlegend. Wikipedia / Google hat hier nicht viel geholfen.
Nehmen wir an, wir haben die Zufallsvariable mit bekannter Varianz und Mittelwert. Die Frage ist: Was ist die Varianz von für eine gegebene Funktion f. Die einzige allgemeine Methode, die mir bekannt ist, ist die Delta-Methode, die jedoch nur eine Annäherung darstellt. Jetzt interessiere ich mich für , aber es …
Angenommen, es gibt Elemente, die in zwei Gruppen aufgeteilt sind ( und ). Die Varianz der ersten Gruppe ist und die Varianz der zweiten Gruppe ist . Es wird angenommen, dass die Elemente selbst unbekannt sind, aber ich kenne die und .m+nm+nm+nmmmnnnσ2mσm2\sigma_m^2σ2nσn2\sigma^2_nμmμm\mu_mμnμn\mu_n Gibt es eine Möglichkeit, die kombinierte Varianz zu …
Ich habe ein gemischtes Effektmodell (in der Tat ein verallgemeinertes additives gemischtes Modell), das mir Vorhersagen für eine Zeitreihe gibt. Um der Autokorrelation entgegenzuwirken, verwende ich ein corCAR1-Modell, da mir Daten fehlen. Die Daten sollen mir eine Gesamtlast geben, daher muss ich über das gesamte Vorhersageintervall summieren. Aber ich sollte …
Wie lautet die Formel für die Varianz des Produkts abhängiger Variablen? Bei unabhängigen Variablen ist die Formel einfach: var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2 {\rm var}(XY) = E(X^{2}Y^{2}) - E(XY)^{2} = {\rm var}(X){\rm var}(Y) + {\rm var}(X)E(Y)^2 + {\rm var}(Y)E(X)^2 Aber wie lautet die Formel für korrelierte Variablen? Wie finde ich übrigens die Korrelation anhand …
Ich werde mein Problem mit einem Beispiel erklären. Angenommen, Sie möchten das Einkommen einer Person anhand einiger Attribute vorhersagen: {Alter, Geschlecht, Land, Region, Stadt}. Sie haben einen Trainingsdatensatz wie diesen train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) …
Ist es möglich, die Endlichkeit (oder Existenz) der Varianz einer Zufallsvariablen anhand einer Stichprobe zu testen? Als Null wäre entweder {die Varianz existiert und ist endlich} oder {die Varianz existiert nicht / ist unendlich} akzeptabel. Philosophisch (und rechnerisch) scheint dies sehr seltsam zu sein, da es keinen Unterschied zwischen einer …
Ich versuche, eine Metrik zum Messen der Ungleichmäßigkeit einer Verteilung für ein Experiment zu finden, das ich durchführe. Ich habe eine Zufallsvariable, die in den meisten Fällen gleichmäßig verteilt sein sollte, und ich möchte in der Lage sein, Beispiele für Datensätze zu identifizieren (und möglicherweise deren Grad zu messen), bei …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.