Überanpassung eines logistischen Regressionsmodells


28

Ist es möglich, ein logistisches Regressionsmodell überzurüsten? Ich habe in einem Video gesehen, dass meine Fläche unter der ROC-Kurve höher als 95% ist, dann ist es sehr wahrscheinlich, dass sie überpasst wird. Kann ein logistisches Regressionsmodell jedoch überpasst werden?


1
Kannst du sagen, welches Video, oder zumindest etwas mehr Kontext geben?
Glen_b

2
Sicher @ Glen_b, das Video war dieser: Link Der Kommentar war bei 40min. Es hieß das Ding: Wenn ROC die AUC zwischen 0,5 und 0,6 hat, war es schlecht. Wenn zwischen 0,6 und 0,7, ist es unterdurchschnittlich. Wenn zwischen 0,7 und 0,75 ist es ein Durchschnitt / Gut. Es liegt zwischen 0,75 und 0,8 und ist gut. Liegt der Wert zwischen 0,8 und 0,9, ist er exzellent. Wenn höher als 0,9, ist es verdächtig und wenn höher als 0,95, ist es überdimensioniert. Ich fand diese Erklärung sehr leicht zu verstehen, aber richtig? Weil ich nach etwas suche, um diesen Gedanken zu stützen, aber ich nicht finde.
Carlosedubarreto

Und Glen_B, die Erklärung, die @AdamO gegeben hat, scheint, dass die Erklärung, die ich auf dem Video gesehen habe, nicht genau richtig war, aber vielleicht habe ich Adams Erklärung falsch verstanden. Diese Statiscs Sachen sind sehr komplex, aber es ist eine wahre Freude, tief in sie zu graben. :)
carlosedubarreto

Ich denke, AdamOs Erklärung ist gut (ich habe sie positiv bewertet), aber Fragen sollten permanente Ressourcen sein. Ein späterer Leser (z. B. jemand mit einer ähnlichen Frage) möchte möglicherweise wissen, was gesagt wurde. Ich denke, dass Ihre Beschreibung im Kommentar für die meisten Menschen ausreichend Kontext bietet und der Link für den Rest ausreicht. Also vielen Dank! Sie haben Ihre Frage nützlicher gemacht.
Glen_b

Vielen Dank @Glen_b, ich lerne, wie man dieses großartige Tool benutzt, das wir haben (dieses Forum). Ich werde Ihren Tipp berücksichtigen, wenn ich neue Fragen stelle.
Carlosedubarreto

Antworten:


35

Ja, Sie können logistische Regressionsmodelle überarbeiten. Aber zuerst möchte ich den Punkt über die AUC (Bereich unter der Betriebskennlinie des Empfängers) ansprechen: Es gibt keine universellen Faustregeln für die AUC, niemals jemals.

Was die AUC ist, ist die Wahrscheinlichkeit, dass ein zufällig abgetastetes Positiv (oder Fall) einen höheren Markerwert als ein Negativ (oder eine Kontrolle) hat, da die AUC der U-Statistik mathematisch äquivalent ist.

Was die AUC nicht ist, ist ein standardisiertes Maß für die Vorhersagegenauigkeit. Hochdeterministische Ereignisse können AUCs mit einem einzelnen Prädiktor von 95% oder mehr aufweisen (wie in der kontrollierten Mechatronik, Robotik oder Optik). Einige komplexe Modelle zur multivariablen logistischen Risikoprognose haben AUCs von 64% oder weniger, wie die Brustkrebsrisikoprognose respektabel hohe Vorhersagegenauigkeit.

Ein vernünftiger AUC-Wert wird wie bei einer Leistungsanalyse festgelegt, indem Kenntnisse über den Hintergrund und die Ziele einer Apriori- Studie gesammelt werden . Der Arzt / Ingenieur beschreibt, was sie wollen, und Sie als Statistiker legen einen AUC-Zielwert für Ihr Vorhersagemodell fest. Dann beginnt die Untersuchung.

Es ist in der Tat möglich, ein logistisches Regressionsmodell überzurüsten. Abgesehen von der linearen Abhängigkeit (wenn die Modellmatrix einen mangelhaften Rang hat) können Sie auch eine perfekte Konkordanz haben, oder das ist die Darstellung angepasster Werte gegen Y, die Fälle und Kontrollen perfekt unterscheidet. In diesem Fall sind Ihre Parameter nicht konvergiert, sondern befinden sich einfach irgendwo im Grenzbereich, der eine Wahrscheinlichkeit von ergibt . Manchmal ist die AUC jedoch nur zufällig 1.

Es gibt eine andere Art von Verzerrung, die dadurch entsteht, dass dem Modell zu viele Prädiktoren hinzugefügt werden, und das ist eine kleine Stichprobenverzerrung. Im Allgemeinen tendieren die logarithmischen Quotenverhältnisse eines logistischen Regressionsmodells aufgrund der Nichtkollabierbarkeit des Quotenverhältnisses und der Anzahl der Zellen von Null zu einem voreingenommenen Faktor von . In der Folgerung wird dies unter Verwendung einer bedingten logistischen Regression behandelt, um Verwechslungs- und Präzisionsvariablen in geschichteten Analysen zu kontrollieren. In der Vorhersage sind Sie jedoch SooL. Es gibt keine verallgemeinerbare Vorhersage, wenn Sie p n π ( 1 - π ) haben ( π = Prob ( Y = 1 )2βpnπ(1π)π=Prob(Y=1)), weil Sie zu diesem Zeitpunkt garantiert die "Daten" und nicht den "Trend" modelliert haben. Hochdimensional (großVorhersage p ) von binären Ergebnissen ist mit maschinellen Lernmethoden besser möglich. Das Verständnis der linearen Diskriminanzanalyse, der partiellen kleinsten Quadrate, der Vorhersage des nächsten Nachbarn, des Boosting und der Zufallswälder wäre ein sehr guter Ausgangspunkt.p


Wenn du sagst , dann meinst du wohl den Anteil der Zeit, die y = 1 ist? Und nicht die Summe der Häufigkeit, mit der y = 1 ist? y
generic_user

Das war verwirrend, p ist die Anzahl der Parameter im Modell, ich verwende jetzt für den Anteil. Vielen Dank für den Hinweis. π
AdamO

Wie bestimmen Sie den richtigen AUC-Wert für das Ziel?
Kevin H. Lin

1
@ KevinH.Lin Es kommt auf die Art der Frage an. Je mehr Sie kontextbezogenes Wissen einbringen, desto besser. Dies wäre die zugrunde liegende Prävalenz oder Last von Krankheiten oder Zuständen, die das Modell bewertet, die Leistung bestehender (konkurrierender) Modelle, Kompromisse in Bezug auf die Kostenwirksamkeit und die Maßnahmen im Zusammenhang mit der Annahme neuer Praktiken und / oder Empfehlungen. Nichts davon ist schwarz-weiß, aber wie so viele andere Dinge müssen Sie überzeugend argumentieren, um für einen AUC-Wert zu überzeugen und zu argumentieren, den Sie als Statistiker vorgeben.
AdamO

1
@ KevinH.Lin Ich glaube nicht, dass eine gültige Antwort so klar und prägnant sein wird, wie Sie es zu wollen scheinen. Es ist so, als würde man fragen: "Welches Auto soll ich kaufen?" :) Ich schlage vor, dass Sie Artikel überprüfen, die AUCs in dem relevanten Forschungsbereich untersucht haben, der Sie interessiert. Ich habe hauptsächlich mit Risikovorhersagemodellen für Brustkrebs gearbeitet und unter anderem anhand der Arbeiten von Tice, Gail und Barlow festgestellt, dass eine AUC von 0,65 für populationsbasierte Vorhersagemodelle mit einer Prävalenz von weniger als 1 bis 20 Vorfallsfällen sehr attraktiv ist pro 5.000 gefährdete Personenjahre unter Verwendung von 7 Risikofaktoren mit einem RR von 1,5 und 3.
AdamO

6

Mit einfachen Worten: Ein überarbeitetes logistisches Regressionsmodell weist eine große Varianz auf, was bedeutet, dass sich die Entscheidungsgrenzen weitgehend ändern, wenn sich die Größe nur geringfügig ändert. Betrachten Sie folgendes Bild: Das am weitesten rechts stehende ist ein überarbeitetes Logistikmodell, dessen Entscheidungsgrenzen groß sind. von Höhen und Tiefen, während die mittlere gerade fit ist, hat es moderate Varianz und moderate Voreingenommenheit. Das linke ist underfit, es hat eine hohe Vorspannung, aber eine sehr geringe Varianz. eins noch_ Ein überangepasstes Regressionsmodell verfügt über zu viele Funktionen, während ein unterangepasstes Modell über weniger Funktionen verfügt. von Funktionen. Bild zeigt logistisches Resionsmodell für Unter-, Justfit- und Überausstattung.  Blau gefärbte Markierung zeigt Entscheidungsgrenze.


8
Bitte geben Sie die Referenz für das Bild an (tatsächlich der Kurs von Andrew Ng).
Alexander Rodin

5

Sie können mit jeder Methode überanpassen, auch wenn Sie der gesamten Population entsprechen (wenn die Population endlich ist). Es gibt zwei allgemeine Lösungen für das Problem: (1) Bestrafung der maximalen Wahrscheinlichkeit (Gratregression, elastisches Netz, Lasso usw.) und (2) Verwendung informativer Prioritäten mit einem Bayes'schen Modell.

YYYY


4

Gibt es ein Modell, abgesehen von der logistischen Regression, dass eine Überanpassung nicht möglich ist?

Eine Überanpassung entsteht grundsätzlich, weil Sie zu einer Stichprobe passen und nicht zur gesamten Population. Artefakte Ihrer Stichprobe können wie Merkmale der Population erscheinen und sind daher keine überpassenden Verletzungen.

Es ist eine Frage der äußeren Gültigkeit. Verwenden Sie nur die Stichprobe, um ein Modell zu erhalten, mit dem Sie die beste Leistung für die reale Population erzielen, die Sie nicht sehen können.

Sicher, einige Modellformen oder -verfahren passen sich mit größerer Wahrscheinlichkeit an als andere, aber kein Modell ist jemals wirklich immun gegen Überanpassung, oder?

Selbst eine Validierung außerhalb der Stichprobe, Regularisierungsverfahren usw. können nur vor einer Überanpassung schützen, aber es gibt kein Patentrezept. In der Tat muss man immer davon ausgehen, dass es tatsächlich zu einem gewissen Grad an Überanpassung gekommen ist, wenn man das Vertrauen abschätzen möchte, dass man auf der Basis eines angepassten Modells eine Prognose für die reale Welt erstellt.

Inwieweit können Abweichungen auftreten, aber selbst ein Modell, das für ein Hold-Out-Dataset validiert wurde, erbringt selten eine In-Wild-Leistung, die mit der im Hold-Out-Dataset erzielten übereinstimmt. Und Überanpassung ist ein großer ursächlicher Faktor.


0

Was wir mit dem Roc tun, um auf Überanpassung zu prüfen, ist, den Datensatz in Training und Bewertung zufällig zu trennen und die AUC zwischen diesen Gruppen zu vergleichen. Wenn die AUC im Training "viel" (es gibt auch keine Faustregel) größer ist, liegt möglicherweise eine Überanpassung vor.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.