Statistiken und Big Data terminology

3

Was genau ist ein Hypothesenraum beim maschinellen Lernen?

Während ich den Begriff konzeptionell verstehe, habe ich Schwierigkeiten, ihn operativ zu verstehen. Könnte mir jemand mit einem Beispiel helfen?

10 machine-learning terminology definition

1

Hat die Funktion einen Standardnamen?

Hat eine Funktion in der Form einen Standardnamen? ZB ist eine lineare Funktion.ex/ (1+ ex)ex/.(1+ex)e^x/(1+e^x)y= a + b xy=ein+bxy = a + bx

9 logistic neural-networks deep-learning terminology

2

Bias-Varianz-Zerlegung: Begriff für den erwarteten quadratischen Prognosefehler abzüglich des nicht reduzierbaren Fehlers

Hastie et al. "Die Elemente des statistischen Lernens" (2009) betrachten einen Datenerzeugungsprozess mit und .Y=f(X)+εY=f(X)+ε Y = f(X) + \varepsilon E(ε)=0E(ε)=0\mathbb{E}(\varepsilon)=0Var(ε)=σ2εVar(ε)=σε2\text{Var}(\varepsilon)=\sigma^2_{\varepsilon} Sie zeigen die folgende Bias-Varianz-Zerlegung des erwarteten quadratischen Prognosefehlers am Punkt (S. 223, Formel 7.9): In my eigene Arbeit Ich gebe nicht sondern nehme stattdessen eine willkürliche Prognose (falls …

9 variance forecasting prediction terminology bias

1

Was ist der Unterschied zwischen vielfältigem Lernen und nichtlinearer Dimensionsreduktion?

Was ist der Unterschied zwischen vielfältigem Lernen und nichtlinearer Dimensionsreduktion ? Ich habe gesehen, dass diese beiden Begriffe synonym verwendet werden. Beispielsweise: http://www.cs.cornell.edu/~kilian/research/manifold/manifold.html : Manifold Learning (oft auch als nichtlineare Dimensionsreduktion bezeichnet) verfolgt das Ziel, Daten, die ursprünglich in einem hochdimensionalen Raum liegen, in einen Raum mit niedrigeren Dimensionen einzubetten …

9 terminology dimensionality-reduction manifold-learning

1

Nomenklatur für die linke und rechte Seite in Regressionsmodellen

y=β0+β1x1+ε0y=β0+β1x1+ε0y = \beta_{0} + \beta_{1}x_{1} + \varepsilon_{0} Die Sprache zur Beschreibung von Regressionsmodellen, wie die oben angegebene sehr einfache lineare Regression, variiert häufig, und solche Variationen weisen häufig geringfügige Bedeutungsverschiebungen auf. Zum Beispiel kann der Teil des Modells auf der linken Seite der Gleichung mit Konnotationen und Bezeichnungen in Klammern …

9 regression terminology

1

Bezieht sich „Protokollverlust“ auf logarithmischen Verlust oder logistischen Verlust?

Ich weiß, dass ich es in beide Richtungen gesehen habe. Gibt es also einen Unterschied zwischen den beiden und auf welchen wird häufiger Bezug genommen?

9 logistic terminology logarithm loss-functions

1

Was ist gewöhnlich in gewöhnlichen kleinsten Quadraten?

Ein Freund von mir hat kürzlich gefragt, was so gewöhnlich ist, über gewöhnliche kleinste Quadrate. Wir schienen in der Diskussion nicht weiterzukommen. Wir waren uns beide einig, dass OLS ein Sonderfall des linearen Modells ist, viele Verwendungszwecke hat, bekannt ist und ein Sonderfall vieler anderer Modelle ist. Aber ist das …

9 regression linear-model least-squares terminology

1

Datenraum, variabler Raum, Beobachtungsraum, Modellraum (zB in linearer Regression)

Angenommen, wir haben die Datenmatrix , die mal- , und den Markierungsvektor , der mal-eins ist. Hier ist jede Zeile der Matrix eine Beobachtung, und jede Spalte entspricht einer Dimension / Variablen. ( annehmen )XX\mathbf{X}nnnpppYYYn > pnnnn>pn>pn>p Und was tun data space, variable space, observation space, model spacebedeuten? Ist der …

9 regression multiple-regression terminology geometry biplot

2

In welchen wissenschaftlichen Bereichen wird untersucht, wie Menschen quantitative Zusammenfassungen und Visualisierungen interpretieren?

Es gibt eine Fülle bekannter Ressourcen, die Ratschläge zur Datenvisualisierung geben. (ZB Tufte, Stephen Few et al. , Nathan Yau .) Aber an welche Bereiche könnte man sich wenden, um Antworten auf Fragen wie diese zu erhalten: Ist die Tortendiagrammkritik in der Praxis relevant? Können Menschen die lineare Skalenlänge so …

9 data-visualization interpretation terminology presentation

1

Was ist der Unterschied zwischen einem statistischen Nullhypothesentest und einem anderen Test?

Ein aktuelles heißes Diskussionsthema betrifft eine Zeitschrift, die die Verwendung von "statistischen Nullhypothesen-Testverfahren (NHSTPs)" aus Artikeln verbietet, die an die Zeitschrift übermittelt wurden. Ich sehe diesen Begriff von einigen Schriftstellern verwendet, aber ich verstehe nicht, welchen Unterschied sie machen wollen. Unterscheidet sich ein NHSTP von einem "Hypothesentest" oder einem "Signifikanztest"?

9 hypothesis-testing statistical-significance terminology

1

Wie fair ist es, das Wort „Vorhersagen“ für (logistische) Regression zu verwenden?

Mein Verständnis ist, dass selbst Regression keine Kausalität gibt. Es kann nur eine Assoziation zwischen y-Variablen und x-Variablen und möglicherweise eine Richtung geben. Hab ich recht? Ich habe oft Sätze gefunden, die "x sagt y voraus" ähneln, selbst in den meisten Lehrbüchern und auf verschiedenen Kursseiten online. Und Sie nennen …

9 regression logistic predictive-models terminology causality

3

Ist die Berechnung der „tatsächlichen Deckungswahrscheinlichkeit“ dasselbe wie die Berechnung eines „glaubwürdigen Intervalls“?

Ich habe ein Lehrbuch für Einsteigerstatistiken gelesen. Im Kapitel über die Maximum-Likelihood-Schätzung des Erfolgsanteils in Daten mit Binomialverteilung wurde eine Formel zur Berechnung eines Konfidenzintervalls angegeben und anschließend nonchalant erwähnt Betrachten Sie die tatsächliche Abdeckungswahrscheinlichkeit, dh die Wahrscheinlichkeit, dass die Methode ein Intervall erzeugt, das den wahren Parameterwert erfasst. Dies …

9 confidence-interval terminology coverage-probability

3

Wie wird der RMSE durch den aufgerufenen Mittelwert normalisiert?

Ich habe den Root Mean Squared Error(RMSE) verwendet, um die Genauigkeit von Werten zu messen, die unter Verwendung eines Modells vorhergesagt wurden. Ich verstehe, dass der zurückgegebene Wert die Einheiten meiner Kennzahlen (anstelle eines Prozentsatzes) verwendet. Ich möchte jedoch meine Werte als Prozentsatz angeben. Der Ansatz, den ich gewählt habe, …

9 error terminology

2

Was ist französische Datenanalyse?

Einige statistische Methoden - ich erinnere mich nicht, ob es sich um eine Hauptkomponentenanalyse oder ähnliches handelt - werden manchmal als "französische Datenanalyse" bezeichnet. Was ist es genau ? Und einige Leute sagen, dass dieser Name ironisch ist, ist es wahr und warum?

9 multivariate-analysis terminology correspondence-analysis

1

Wie definiere ich, was eine „Probe“ ist?

Wenn ich Ihnen drei Zahlen gebe, die unabhängig und identisch aus einer Standardnormalverteilung stammen, habe ich Ihnen dann drei oder eine Stichprobe gegeben? Wenn die Antwort ein Beispiel ist, gibt es dann einen kurzen Namen für das, wovon ich Ihnen drei gegeben habe?

9 sample terminology definition

Als «terminology» getaggte Fragen