Die erwartete quadratische Abweichung einer Zufallsvariablen von ihrem Mittelwert; oder die durchschnittliche quadratische Abweichung der Daten über ihren Mittelwert.
Dies ist eine sehr grundlegende Frage. Warum verwenden wir eine Chi-Quadrat-Verteilung? Was bedeutet diese Verteilung? Warum wird mit dieser Verteilung ein Konfidenzintervall für die Varianz erstellt? An jedem Ort, an dem ich nach einer Erklärung suche, wird dies nur als eine Tatsache dargestellt, in der erklärt wird, wann Chi verwendet …
Angenommen, und haben einen endlichen zweiten Moment. Im Hilbertraum von Zufallsvariablen mit zweitem endlichen Moment (mit dem durch definierten inneren Produkt von , ) können wir interpretieren als die Projektion von auf den Raum der Funktionen von .XXXYYYT1,T2T1,T2T_1,T_2E(T1T2)E(T1T2)E(T_1T_2)||T||2=E(T2)||T||2=E(T2)||T||^2=E(T^2)E(Y|X)E(Y|X)E(Y|X)YYYXXX Wir wissen auch, dass das Gesetz der totalen Varianz lautet: Var(Y)=E(Var(Y|X))+Var(E(Y|X))Var(Y)=E(Var(Y|X))+Var(E(Y|X))Var(Y)=E(Var(Y|X)) + …
Beim Lesen der Kaggle-Essay-Eval-Methode bin ich auf eine varianzstabilisierende Transformation gestoßen . Sie verwenden eine Varianzstabilisierungstransformation, um Kappa-Werte zu transformieren, bevor sie ihren Mittelwert bilden und sie dann zurücktransformieren. Obwohl ich das Wiki über Varianzstabilisierende Transformationen gelesen habe, kann ich nicht verstehen, warum wir Varianzen tatsächlich stabilisieren. Welchen Nutzen ziehen …
Fragen Kommt es darauf an, ob der Baum flach oder tief ist? Oder können wir das unabhängig von der Tiefe / Höhe des Baumes sagen? Warum ist die Vorspannung niedrig und die Varianz hoch? Erklären Sie dies bitte intuitiv und mathematisch
Ich habe immer wieder gelesen, dass die Kreuzvalidierung "Auslassen" aufgrund der großen Überlappung der Trainingsfalten eine hohe Varianz aufweist. Ich verstehe jedoch nicht, warum das so ist: Sollte die Leistung der Kreuzvalidierung nicht sehr stabil sein (geringe Varianz), gerade weil die Trainingssätze fast identisch sind? Oder habe ich ein falsches …
Ich habe einen Datensatz mit 11 Variablen und PCA (orthogonal) wurde gemacht, um die Daten zu reduzieren. Die Wahl der Anzahl der Komponenten, die beibehalten werden sollen, ergab sich für mich aus meinem Fachwissen und dem Geröllplot (siehe unten), dass zwei Hauptkomponenten (PCs) ausreichten, um die Daten zu erläutern, und …
Ich bin nicht so gut in Statistik, also entschuldige mich, wenn dies eine vereinfachende Frage ist. Ich passe eine Kurve an einige Daten an, und manchmal passen meine Daten am besten zu einem negativen Exponential in der Form a∗e(−b∗x)+ca∗e(−b∗x)+ca * e^{(-b * x)} + c , und manchmal ist die …
Ich führe ein Experiment durch, bei dem ich (unabhängige) Samples parallel sammle, ich berechne die Varianz jeder Gruppe von Samples und jetzt möchte ich dann alle kombinieren, um die Gesamtvarianz aller Samples zu finden. Es fällt mir schwer, eine Ableitung dafür zu finden, da ich mir der Terminologie nicht sicher …
Ich habe den Begriff "Heywood-Fall" informell verwendet, um Situationen zu bezeichnen, in denen eine online durchgeführte, "endliche Antwort" iterativ aktualisierte Schätzung der Varianz aufgrund von numerischen Genauigkeitsproblemen negativ wurde. (Ich verwende eine Variante der Welford-Methode, um Daten hinzuzufügen und ältere Daten zu entfernen.) Ich hatte den Eindruck, dass sie auf …
θ^\hat\thetaθ∗\theta^*nn Sie ‖ θ - θ * ‖ ∥θ^−θ∗∥\lVert\hat\theta-\theta^*\rVertO ( 1 / √n )O(1/n−−√)O(1/\sqrt n)‖E θ -θ*‖∥Eθ^−θ∗∥\lVert \mathbb E\hat\theta - \theta^*\rVert‖E θ - θ ‖∥Eθ^−θ^∥\lVert \mathbb E\hat\theta - \hat\theta\rVertO(1/ √n )O(1/n−−√)O(1/\sqrt{n}) Ich interessiere mich für Modelle mit einer Abweichung , die schneller als schrumpft, bei der der Fehler jedoch nicht …
Ich habe im Internet nachgeschlagen, aber nichts Hilfreiches gefunden. Ich suche im Grunde nach einer Methode, um zu messen, wie „gleichmäßig“ ein Wert verteilt ist. Wie in einer "gleichmäßig" verteilten Distribution wie X : und eine 'ungleich' verteilte Verteilung Y von ungefähr dem gleichen Mittelwert und der gleichen Standardabweichung: Aber …
Ich habe ein Experiment durchgeführt, bei dem ich verschiedene Familien aus zwei verschiedenen Bevölkerungsgruppen großgezogen habe. Jede Familie erhielt eine von zwei Behandlungen. Nach dem Experiment habe ich mehrere Merkmale an jedem Individuum gemessen. Um die Wirkung einer Behandlung oder einer Quelle sowie deren Wechselwirkung zu testen, verwendete ich ein …
Ich bin ein Neuling in Statistik und R und habe Probleme mit der Verwendung der Levene-Funktion (ich möchte die Varianzgleichheit von zwei Stichproben prüfen). In der Dokumentation steht, dass ich Folgendes ausführen soll: levene.test (y, Gruppe) Aber ich habe keine Ahnung, was ich als y und Gruppe setzen soll? Ich …
Es scheint eine Menge Verwirrung im Vergleich zwischen der Verwendung von glmnetinside caretzur Suche nach einem optimalen Lambda und der Verwendung cv.glmnetderselben Aufgabe zu geben. Viele Fragen wurden gestellt, zB: Klassifizierungsmodell train.glmnet vs. cv.glmnet? Was ist der richtige Weg, um glmnet mit caret zu verwenden? Quervalidierung von "glmnet" mit "caret" …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.