Warum werden Regressionsprobleme als "Regressionsprobleme" bezeichnet?


Antworten:


34

Der Begriff "Regression" wurde von Francis Galton in seiner Abhandlung von 1886 "Regression zur Mittelmäßigkeit in erblicher Statur" verwendet. Meines Wissens verwendete er den Begriff nur im Kontext der Regression zum Mittelwert . Der Begriff wurde dann von anderen übernommen, um mehr oder weniger die Bedeutung zu erhalten, die er heute als allgemeine statistische Methode hat.


15
Galton leitete eine lineare Annäherung ab, um die Größe eines Sohnes von der Größe des Vaters in dieser Arbeit zu schätzen. Seine Gleichung wurde so angepasst, dass ein Vater mit durchschnittlicher Größe einen Sohn mit durchschnittlicher Größe hat, ein Vater mit überdurchschnittlicher Größe jedoch einen Sohn, der um 2/3 größer als der Durchschnitt seines Vaters ist. Gleich mit kürzer als der Durchschnitt. Dies könnte als einfache lineare Regression (heutige Bedeutung) angesehen werden. Und natürlich hat Regression heute eine noch umfassendere Bedeutung: Es ist jedes Modell, das kontinuierliche Vorhersagen macht. Es ist interessant, wie sehr sich sein ursprünglicher Gebrauch dieses Wortes geändert hat.
rm999

3
Antwort per NRH ist richtig. Der folgende Link gibt viel mehr zu Francis Galton Papier „Regression in Richtung Mittelmäßigkeit in erblicher Statur“ blog.minitab.com/blog/statistics-and-quality-data-analysis/...
Gaurav Singhal

Ist es an der Zeit, dass die Statistik-Community das Wort "Regression" durch einen einfacheren und klareren Begriff ersetzt, vielleicht durch einen "formelhaften Prädiktor"?
Aviad Rozenhek

4

Im Gegensatz zum Fortschritt fallen wir auf den Mittelwert zurück, dh auf den Rückschritt. Daher der Begriff Regression! Ich denke, es ist etwas, das aufgegriffen und festgefahren wurde.


2

@ Mark White erwähnte den Link bereits, aber für diejenigen unter Ihnen, die nicht viel Zeit haben, um den Link zu überprüfen, ist hier die genaue Antwort, auf die richtig verwiesen wird:

Ursprung der "Regression"

Der Begriff "Regression" wurde von Francis Galton im 19. Jahrhundert geprägt, um ein biologisches Phänomen zu beschreiben. Das Phänomen bestand darin, dass die Höhe der Nachkommen großer Vorfahren tendenziell auf einen normalen Durchschnitt abfällt (ein Phänomen, das auch als Regression zum Mittelwert bezeichnet wird) (Galton, neu gedruckt 1989). Für Galton hatte die Regression nur diese biologische Bedeutung (Galton, 1887) , aber seine Arbeit wurde später von Udny Yule und Karl Pearson auf einen allgemeineren statistischen Kontext ausgedehnt (Pearson, 1903).

Verweise

https://en.wikipedia.org/wiki/Regression_analysis#History

Galton, F. (1877). Typische Vererbungsgesetze. III. Nature 15 (389), 512-514.

Galton, F. (nachgedruckt 1989). Verwandtschaft und Korrelation. Statistische Wissenschaft, 4 (2), 80-86.

Pearson, K. (1903). Das Gesetz der Ahnenvererbung. Biometrika, 2 (2), 211 & ndash ; 228.


Galtons Regression als "Regression zum Mittelwert" macht Sinn. Ich verstehe den
Ausdruck

1
Dies bedeutet im Allgemeinen, dass maschinelles Lernen zwar Regression verwendet, Regression jedoch trotz der weit verbreiteten, falschen Meinung keine maschinelle Lernmethode ist. Statistisches Lernen unterscheidet sich vom maschinellen Lernen, aber im Allgemeinen bezeichnen ML-Befürworter statistische Methoden fälschlicherweise als ML, sodass die offensichtlichen Inkongruenzen auftauchen. Galtons Regression ist Regression; es hat mit der Modellierung / Vorhersage einer Tendenz zu tun.
LSC

0

"Regression" kommt von "regress", was wiederum vom lateinischen "regressus" kommt - um (auf etwas) zurückzugehen.

In diesem Sinne ist Regression die Technik, die es ermöglicht, von chaotischen, schwer zu interpretierenden Daten zu einem klareren und aussagekräftigeren Modell zurückzukehren. Als Physiker mag ich die Idee, dass Physiker Naturphänomene als die vielfältigen möglichen Ergebnisse eines relativ einfachen Naturgesetzes betrachten.

Mit anderen Worten, das Wort Regression scheint darauf hinzudeuten, dass Daten nur der sichtbare, greifbare Effekt eines "statistischen Modells" sind. Mit anderen Worten, das Modell steht an erster Stelle, und Sie möchten anhand der Daten "zurückgehen", woher sie stammen.


0

Wie ich weiß, ist das Wort regressionin der statistischen Bedeutung die Messung der Beziehung zwischen dem Mittelwert einer Variablen und den entsprechenden Werten anderer Variablen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.