Hastie et al. "Die Elemente des statistischen Lernens" (2009) betrachten einen Datenerzeugungsprozess mit und .Y=f(X)+εY=f(X)+ε Y = f(X) + \varepsilon E(ε)=0E(ε)=0\mathbb{E}(\varepsilon)=0Var(ε)=σ2εVar(ε)=σε2\text{Var}(\varepsilon)=\sigma^2_{\varepsilon} Sie zeigen die folgende Bias-Varianz-Zerlegung des erwarteten quadratischen Prognosefehlers am Punkt (S. 223, Formel 7.9): In my eigene Arbeit Ich gebe nicht sondern nehme stattdessen eine willkürliche Prognose (falls …
Was ist der Unterschied zwischen vielfältigem Lernen und nichtlinearer Dimensionsreduktion ? Ich habe gesehen, dass diese beiden Begriffe synonym verwendet werden. Beispielsweise: http://www.cs.cornell.edu/~kilian/research/manifold/manifold.html : Manifold Learning (oft auch als nichtlineare Dimensionsreduktion bezeichnet) verfolgt das Ziel, Daten, die ursprünglich in einem hochdimensionalen Raum liegen, in einen Raum mit niedrigeren Dimensionen einzubetten …
y=β0+β1x1+ε0y=β0+β1x1+ε0y = \beta_{0} + \beta_{1}x_{1} + \varepsilon_{0} Die Sprache zur Beschreibung von Regressionsmodellen, wie die oben angegebene sehr einfache lineare Regression, variiert häufig, und solche Variationen weisen häufig geringfügige Bedeutungsverschiebungen auf. Zum Beispiel kann der Teil des Modells auf der linken Seite der Gleichung mit Konnotationen und Bezeichnungen in Klammern …
Ich weiß, dass ich es in beide Richtungen gesehen habe. Gibt es also einen Unterschied zwischen den beiden und auf welchen wird häufiger Bezug genommen?
Ein Freund von mir hat kürzlich gefragt, was so gewöhnlich ist, über gewöhnliche kleinste Quadrate. Wir schienen in der Diskussion nicht weiterzukommen. Wir waren uns beide einig, dass OLS ein Sonderfall des linearen Modells ist, viele Verwendungszwecke hat, bekannt ist und ein Sonderfall vieler anderer Modelle ist. Aber ist das …
Angenommen, wir haben die Datenmatrix , die mal- , und den Markierungsvektor , der mal-eins ist. Hier ist jede Zeile der Matrix eine Beobachtung, und jede Spalte entspricht einer Dimension / Variablen. ( annehmen )XX\mathbf{X}nnnpppYYYn > pnnnn>pn>pn>p Und was tun data space, variable space, observation space, model spacebedeuten? Ist der …
Es gibt eine Fülle bekannter Ressourcen, die Ratschläge zur Datenvisualisierung geben. (ZB Tufte, Stephen Few et al. , Nathan Yau .) Aber an welche Bereiche könnte man sich wenden, um Antworten auf Fragen wie diese zu erhalten: Ist die Tortendiagrammkritik in der Praxis relevant? Können Menschen die lineare Skalenlänge so …
Ein aktuelles heißes Diskussionsthema betrifft eine Zeitschrift, die die Verwendung von "statistischen Nullhypothesen-Testverfahren (NHSTPs)" aus Artikeln verbietet, die an die Zeitschrift übermittelt wurden. Ich sehe diesen Begriff von einigen Schriftstellern verwendet, aber ich verstehe nicht, welchen Unterschied sie machen wollen. Unterscheidet sich ein NHSTP von einem "Hypothesentest" oder einem "Signifikanztest"?
Mein Verständnis ist, dass selbst Regression keine Kausalität gibt. Es kann nur eine Assoziation zwischen y-Variablen und x-Variablen und möglicherweise eine Richtung geben. Hab ich recht? Ich habe oft Sätze gefunden, die "x sagt y voraus" ähneln, selbst in den meisten Lehrbüchern und auf verschiedenen Kursseiten online. Und Sie nennen …
Ich habe ein Lehrbuch für Einsteigerstatistiken gelesen. Im Kapitel über die Maximum-Likelihood-Schätzung des Erfolgsanteils in Daten mit Binomialverteilung wurde eine Formel zur Berechnung eines Konfidenzintervalls angegeben und anschließend nonchalant erwähnt Betrachten Sie die tatsächliche Abdeckungswahrscheinlichkeit, dh die Wahrscheinlichkeit, dass die Methode ein Intervall erzeugt, das den wahren Parameterwert erfasst. Dies …
Ich habe den Root Mean Squared Error(RMSE) verwendet, um die Genauigkeit von Werten zu messen, die unter Verwendung eines Modells vorhergesagt wurden. Ich verstehe, dass der zurückgegebene Wert die Einheiten meiner Kennzahlen (anstelle eines Prozentsatzes) verwendet. Ich möchte jedoch meine Werte als Prozentsatz angeben. Der Ansatz, den ich gewählt habe, …
Einige statistische Methoden - ich erinnere mich nicht, ob es sich um eine Hauptkomponentenanalyse oder ähnliches handelt - werden manchmal als "französische Datenanalyse" bezeichnet. Was ist es genau ? Und einige Leute sagen, dass dieser Name ironisch ist, ist es wahr und warum?
Wenn ich Ihnen drei Zahlen gebe, die unabhängig und identisch aus einer Standardnormalverteilung stammen, habe ich Ihnen dann drei oder eine Stichprobe gegeben? Wenn die Antwort ein Beispiel ist, gibt es dann einen kurzen Namen für das, wovon ich Ihnen drei gegeben habe?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.