Was ist der Zusammenhang zwischen partiellen kleinsten Quadraten, reduzierter Rangregression und Hauptkomponentenregression?


16

Sind reduzierte Rangregression und Hauptkomponentenregression nur Sonderfälle von partiellen kleinsten Quadraten?

In diesem Lernprogramm (Seite 6, "Objektivvergleich") wird angegeben, dass bei Teilquadraten ohne X- oder Y-Projektion (dh "nicht partiell") die Rang- oder Hauptkomponentenregression entsprechend verringert wird.

Eine ähnliche Erklärung finden Sie auf dieser SAS-Dokumentationsseite in den Abschnitten "Reduzierte Rangregression" und "Beziehungen zwischen Methoden".

Eine grundlegendere Folgefrage ist, ob ihnen ähnliche Wahrscheinlichkeitsmodelle zugrunde liegen.


Das ist wirklich ein wichtiges Problem.
Steve

@Steve. Vielen Dank. Siehe meine Kommentare oben für eine detailliertere Einführung.
Minkov

Antworten:


15

Hierbei handelt es sich um drei verschiedene Methoden, von denen keine als Sonderfall einer anderen angesehen werden kann.

Formal, wenn und Y zentrierte Prädiktordatensätze ( n × p ) und Antwortdatensätze ( n × q ) sind und wenn wir nach dem ersten Achsenpaar suchen, gilt wR p für XXYn×pn×qwRpX und für Y , dann diese Methoden Maximieren Sie die folgenden Mengen:vRqY

PCA:Var(Xw)RRR:Var(Xw)Corr2(Xw,Yv)Var(Yv)PLS:Var(Xw)Corr2(Xw,Yv)Var(Yv)=Cov2(Xw,Yv)CCA:Var(Xw)Corr2(Xw,Yv)

(Ich habe dieser Liste die kanonische Korrelationsanalyse (CCA) hinzugefügt.)


Ich vermute, dass die Verwirrung daran liegen könnte, dass in SAS alle drei Methoden über dieselbe Funktion PROC PLSmit unterschiedlichen Parametern implementiert zu sein scheinen . Es scheint also, dass alle drei Methoden Sonderfälle von PLS sind, denn so wird die SAS-Funktion benannt. Dies ist jedoch nur eine unglückliche Benennung. In Wirklichkeit sind PLS, RRR und PCR drei verschiedene Methoden, die zufällig in SAS in einer Funktion implementiert werden, die aus irgendeinem Grund aufgerufen wird PLS.

In beiden Tutorials, mit denen Sie verlinkt haben, ist das tatsächlich sehr klar. Seite 6 des Tutorials nennt die Ziele aller drei Methoden und sagt nicht, dass PLS zu RRR oder PCR wird, im Gegensatz zu dem, was Sie in Ihrer Frage behauptet haben. In ähnlicher Weise wird in der SAS-Dokumentation erläutert, dass drei Methoden unterschiedlich sind und Formeln und Intuition angeben:

[P] Die Regression der Hauptkomponenten wählt Faktoren aus, die so viele Prädiktorvariationen wie möglich erklären, die Regression des reduzierten Rangs wählt Faktoren aus, die so viele Antwortvariationen wie möglich erklären, und das partielle kleinste Quadrat gleicht die beiden Ziele aus, wobei nach Faktoren gesucht wird, die sowohl die Antwort- als auch die Prädiktorvariation erklären .

Es gibt sogar eine Abbildung in der SAS-Dokumentation, die ein schönes Spielzeugbeispiel zeigt, in dem drei Methoden unterschiedliche Lösungen ergeben. In diesem Spielzeugbeispiel gibt es zwei Prädiktoren und x 2 und eine Antwortvariable y . Die Richtung in Xx1x2yX , die am meisten mit korrelierten geschieht auf die Richtung der maximalen Varianz der orthogonal zu X . Daher ist PC1 orthogonal zur ersten RRR-Achse und die PLS-Achse liegt irgendwo dazwischen.yX

PCR, PLS, RRR

Man kann der RRR-Verlustfunktion eine Kammstrafe hinzufügen, um eine kammreduzierte Rangregression oder RRRR zu erhalten. Dadurch wird die Regressionsachse in Richtung PC1 gezogen, ähnlich wie PLS. Die Kostenfunktion für RRRR kann jedoch nicht in einer PLS-Form geschrieben werden, sodass sie unterschiedlich bleiben.

y


4
Der Tisch am Ende ist sehr hilfreich. Basierend auf dieser Tabelle kann man PCA, RRR und CCA als "Sonderfälle" von PLS betrachten, wenn man auch denkt, dass Fahrräder und Einräder Sonderfälle eines Dreirads sind. Ich neige nicht dazu, so zu denken.
EdM

2
@EdM, ich denke man kann sagen, dass all diese Methoden Spezialfälle einer Unifying-Methode sind, die eigentlich keinen Namen hat (aber man kann sie erfinden!). Der Name "PLS" hat jedoch bereits eine festgelegte Bedeutung, und diese Bedeutung schließt keine dieser anderen Techniken ein.
Amöbe sagt Reinstate Monica

1
Und danke! Ich habe mich jetzt entschieden, den Tisch an den Anfang der Antwort zu verschieben :)
Amöbe sagt Reinstate Monica

2
XYVar(Xw)αCorr(Xw,Yv)βVar(Yv)γ
Amöbe sagt Reinstate Monica

1
@Moskowitz: Wenn von Methode A als "Spezialfall" von Methode B gesprochen wird, bedeutet dies, dass B allgemeiner ist und A B mit einigen spezifischen Parametern entspricht. Sie bedeuten nicht , dass A unter bestimmten Bedingungen im Datensatz die gleichen Ergebnisse liefert wie B. Daher meine Antwort auf Ihre Frage.
Amöbe sagt Reinstate Monica
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.