Wie erklären wir einem Publikum, das keinen statistischen Hintergrund hat, den Unterschied zwischen logistischer Regression und neuronalem Netzwerk?
Wie erklären wir einem Publikum, das keinen statistischen Hintergrund hat, den Unterschied zwischen logistischer Regression und neuronalem Netzwerk?
Antworten:
Ich nehme an, Sie denken an das, was früher war, und werden in Ihrer Frage zu neuronalen Netzen vielleicht immer noch als "mehrschichtige Perzeptrone" bezeichnet. Wenn ja, dann würde ich das Ganze in Bezug auf Flexibilität über die Form der Entscheidungsgrenze in Abhängigkeit von erklärenden Variablen erklären. Insbesondere für diese Zielgruppe würde ich keine Link-Funktionen / Log-Gewinnchancen usw. erwähnen. Denken Sie nur daran, dass die Wahrscheinlichkeit eines Ereignisses auf der Grundlage einiger Beobachtungen vorhergesagt wird.
Hier ist eine mögliche Reihenfolge:
Der Vorteil dieses Ansatzes besteht darin, dass Sie sich nicht wirklich mit mathematischen Details befassen müssen, um die richtige Idee zu erhalten. Tatsächlich müssen sie weder logistische Regression noch neuronale Netze verstehen, um die Ähnlichkeiten und Unterschiede zu verstehen.
Der Nachteil des Ansatzes ist, dass Sie viele Bilder machen müssen und der Versuchung, sich in die Algebra fallen zu lassen, um Dinge zu erklären, stark widerstehen.
Für eine einfachere Zusammenfassung:
Logistische Regression: Die einfachste Form des neuronalen Netzwerks, die zu geraden Entscheidungsgrenzen führt
Neuronale Netze: Eine Obermenge, die logistische Regression und andere Klassifikatoren umfasst, die komplexere Entscheidungsgrenzen erzeugen können.
(Anmerkung: Ich beziehe mich auf eine "einfache" logistische Regression ohne die Unterstützung integraler Kernel.)
(Referenz: deeplearning.ai Kurse von Andrew Ng, "Logistische Regression als neuronales Netzwerk" und "Planare Datenklassifikation mit einer verborgenen Schicht")
Ich werde die Frage wörtlich nehmen: Jemand ohne Hintergrund in der Statistik. Und ich werde nicht versuchen, dieser Person einen statistischen Hintergrund zu geben. Angenommen, Sie müssen dem CEO eines Unternehmens den Unterschied erklären.
Also: Logistische Regression ist ein Werkzeug zum Modellieren einer kategorialen Variablen in Bezug auf andere Variablen. Auf diese Weise können Sie herausfinden, wie sich Änderungen in den "anderen" Variablen auf die Chancen der verschiedenen Ergebnisse in der ersten Variablen auswirken. Die Ausgabe ist ziemlich einfach zu interpretieren.
Neuronale Netze sind eine Reihe von Methoden, mit denen ein Computer versucht, anhand von Beispielen auf eine Art und Weise zu lernen, die in etwa der Art und Weise entspricht, wie Menschen über Dinge lernen. Dies kann zu Modellen führen, die gute Prädiktoren darstellen, die jedoch in der Regel viel undurchsichtiger sind als die Modelle aus der logistischen Regression.
Mir wurde beigebracht, dass man sich neuronale Netze (mit logistischen Aktivierungsfunktionen) als gewichteten Durchschnitt der Logitfunktionen vorstellen kann, wobei die Gewichte selbst geschätzt werden. Durch Auswahl einer großen Anzahl von Protokollen können Sie jede funktionale Form anpassen. Der Blog-Beitrag von Econometric Sense enthält einige grafische Informationen .
Die anderen Antworten sind großartig. Ich möchte einfach einige Bilder hinzufügen, die zeigen, dass Sie sich die logistische Regression und die logistische Regression mehrerer Klassen (auch bekannt als Maxent, multinomiale logistische Regression, Softmax-Regression, Maximum-Entropy-Klassifikator) als eine spezielle Architektur neuronaler Netze vorstellen können.
Von Sebastian Raschka, Michigan State University, über KDnuggets :
Noch ein paar Beispiele für die logistische Regression in mehreren Klassen:
Eine ähnliche Illustration aus http://www.deeplearningbook.org/ Kapitel 1:
Und noch eines aus TensorFlow-Tutorials :
In Caffe würden Sie beispielsweise die logistische Regression folgendermaßen implementieren :
Ich würde ein Beispiel für ein kompliziertes, aber konkretes Problem verwenden, das das Publikum versteht. Verwenden Sie versteckte Knoten, deren Interpretationen nicht trainiert sind, sondern bestimmte Bedeutungen haben.
Die lineare Regression bestimmt, wie gut es ist, einen weißen Springer auf h4 zu haben. Es mag nicht offensichtlich sein, dass es überhaupt gut ist, aber wenn es auf h4 ist, wurde es nicht erfasst, was wahrscheinlich andere Überlegungen überwiegt. Die lineare Regression stellt wahrscheinlich die groben Werte der Figuren wieder her und es ist besser, die Figuren in Richtung der Mitte des Bretts und auf der Seite des Bretts des Gegners zu haben. Lineare Regression ist nicht in der Lage, Kombinationen zu bewerten, so dass Ihre Dame auf b2 plötzlich wertvoller ist, wenn der gegnerische König auf a1 ist.
Ein neuronales Netzwerk könnte versteckte Knoten für Konzepte haben, wie "materieller Vorteil", "Sicherheit des schwarzen Königs", "Kontrolle des Zentrums", "beide Türme in der D-Datei", "isolierter Königin-Turm-Bauer" oder "Bischof" Mobilität." Einige davon können nur anhand der Platineingaben geschätzt werden, andere müssen sich möglicherweise in einer zweiten oder späteren verborgenen Schicht befinden. Das neuronale Netz kann diese als Eingaben für die endgültige Bewertung der Position verwenden. Diese Konzepte helfen einem Experten bei der Bewertung einer Position. Ein neuronales Netzwerk sollte daher in der Lage sein, genauere Bewertungen vorzunehmen als eine lineare Regression. Die Erstellung des neuronalen Netzwerks ist jedoch aufwändiger, da Sie dessen Struktur auswählen müssen und viel mehr Parameter zum Trainieren zur Verfügung stehen.