Als «terminology» getaggte Fragen

Verwendung und Bedeutung bestimmter technischer Wörter / Konzepte in der Statistik.



2
Bias-Varianz-Zerlegung: Begriff für den erwarteten quadratischen Prognosefehler abzüglich des nicht reduzierbaren Fehlers
Hastie et al. "Die Elemente des statistischen Lernens" (2009) betrachten einen Datenerzeugungsprozess mit und .Y=f(X)+εY=f(X)+ε Y = f(X) + \varepsilon E(ε)=0E(ε)=0\mathbb{E}(\varepsilon)=0Var(ε)=σ2εVar(ε)=σε2\text{Var}(\varepsilon)=\sigma^2_{\varepsilon} Sie zeigen die folgende Bias-Varianz-Zerlegung des erwarteten quadratischen Prognosefehlers am Punkt (S. 223, Formel 7.9): In my eigene Arbeit Ich gebe nicht sondern nehme stattdessen eine willkürliche Prognose (falls …

1
Was ist der Unterschied zwischen vielfältigem Lernen und nichtlinearer Dimensionsreduktion?
Was ist der Unterschied zwischen vielfältigem Lernen und nichtlinearer Dimensionsreduktion ? Ich habe gesehen, dass diese beiden Begriffe synonym verwendet werden. Beispielsweise: http://www.cs.cornell.edu/~kilian/research/manifold/manifold.html : Manifold Learning (oft auch als nichtlineare Dimensionsreduktion bezeichnet) verfolgt das Ziel, Daten, die ursprünglich in einem hochdimensionalen Raum liegen, in einen Raum mit niedrigeren Dimensionen einzubetten …

1
Nomenklatur für die linke und rechte Seite in Regressionsmodellen
y=β0+β1x1+ε0y=β0+β1x1+ε0y = \beta_{0} + \beta_{1}x_{1} + \varepsilon_{0} Die Sprache zur Beschreibung von Regressionsmodellen, wie die oben angegebene sehr einfache lineare Regression, variiert häufig, und solche Variationen weisen häufig geringfügige Bedeutungsverschiebungen auf. Zum Beispiel kann der Teil des Modells auf der linken Seite der Gleichung mit Konnotationen und Bezeichnungen in Klammern …



1
Datenraum, variabler Raum, Beobachtungsraum, Modellraum (zB in linearer Regression)
Angenommen, wir haben die Datenmatrix , die mal- , und den Markierungsvektor , der mal-eins ist. Hier ist jede Zeile der Matrix eine Beobachtung, und jede Spalte entspricht einer Dimension / Variablen. ( annehmen )XX\mathbf{X}nnnpppYYYn > pnnnn>pn>pn>p Und was tun data space, variable space, observation space, model spacebedeuten? Ist der …

2
In welchen wissenschaftlichen Bereichen wird untersucht, wie Menschen quantitative Zusammenfassungen und Visualisierungen interpretieren?
Es gibt eine Fülle bekannter Ressourcen, die Ratschläge zur Datenvisualisierung geben. (ZB Tufte, Stephen Few et al. , Nathan Yau .) Aber an welche Bereiche könnte man sich wenden, um Antworten auf Fragen wie diese zu erhalten: Ist die Tortendiagrammkritik in der Praxis relevant? Können Menschen die lineare Skalenlänge so …

1
Was ist der Unterschied zwischen einem statistischen Nullhypothesentest und einem anderen Test?
Ein aktuelles heißes Diskussionsthema betrifft eine Zeitschrift, die die Verwendung von "statistischen Nullhypothesen-Testverfahren (NHSTPs)" aus Artikeln verbietet, die an die Zeitschrift übermittelt wurden. Ich sehe diesen Begriff von einigen Schriftstellern verwendet, aber ich verstehe nicht, welchen Unterschied sie machen wollen. Unterscheidet sich ein NHSTP von einem "Hypothesentest" oder einem "Signifikanztest"?

1
Wie fair ist es, das Wort „Vorhersagen“ für (logistische) Regression zu verwenden?
Mein Verständnis ist, dass selbst Regression keine Kausalität gibt. Es kann nur eine Assoziation zwischen y-Variablen und x-Variablen und möglicherweise eine Richtung geben. Hab ich recht? Ich habe oft Sätze gefunden, die "x sagt y voraus" ähneln, selbst in den meisten Lehrbüchern und auf verschiedenen Kursseiten online. Und Sie nennen …

3
Ist die Berechnung der „tatsächlichen Deckungswahrscheinlichkeit“ dasselbe wie die Berechnung eines „glaubwürdigen Intervalls“?
Ich habe ein Lehrbuch für Einsteigerstatistiken gelesen. Im Kapitel über die Maximum-Likelihood-Schätzung des Erfolgsanteils in Daten mit Binomialverteilung wurde eine Formel zur Berechnung eines Konfidenzintervalls angegeben und anschließend nonchalant erwähnt Betrachten Sie die tatsächliche Abdeckungswahrscheinlichkeit, dh die Wahrscheinlichkeit, dass die Methode ein Intervall erzeugt, das den wahren Parameterwert erfasst. Dies …

3
Wie wird der RMSE durch den aufgerufenen Mittelwert normalisiert?
Ich habe den Root Mean Squared Error(RMSE) verwendet, um die Genauigkeit von Werten zu messen, die unter Verwendung eines Modells vorhergesagt wurden. Ich verstehe, dass der zurückgegebene Wert die Einheiten meiner Kennzahlen (anstelle eines Prozentsatzes) verwendet. Ich möchte jedoch meine Werte als Prozentsatz angeben. Der Ansatz, den ich gewählt habe, …


1
Wie definiere ich, was eine „Probe“ ist?
Wenn ich Ihnen drei Zahlen gebe, die unabhängig und identisch aus einer Standardnormalverteilung stammen, habe ich Ihnen dann drei oder eine Stichprobe gegeben? Wenn die Antwort ein Beispiel ist, gibt es dann einen kurzen Namen für das, wovon ich Ihnen drei gegeben habe?

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.