Wie würden Sie den Kompromiss zwischen Modellinterpretierbarkeit und Modellvorhersagekraft in Laienbegriffen beschreiben?


7

Ich weiß, dass es von den gestellten Daten und Fragen abhängt, aber stellen Sie sich ein Szenario vor, in dem Sie für einen bestimmten Datensatz entweder ein ziemlich komplexes nichtlineares Modell wählen können (das allerdings schwer zu interpretieren ist), um eine bessere Vorhersagekraft zu erhalten, möglicherweise weil das Modell die vorhandenen Nichtlinearitäten erkennen kann in den Daten oder haben ein einfaches Modell (vielleicht ein lineares Modell oder etwas) mit weniger Vorhersagekraft, aber einfacher zu interpretieren. Hier ist ein sehr guter Beitrag , in dem Ideen zur Interpretation von Modellen des maschinellen Lernens diskutiert werden.

Obwohl die Industrie sehr vorsichtig ist, interessiert sie sich langsam für komplexere Modelle! Trotzdem wollen sie den Kompromiss klar kennen? Ein Datenwissenschaftler ist vielleicht derjenige, der zwischen Datenteam und Entscheidungsträgern sitzt und oft in der Lage sein muss, diese Dinge in Laienbegriffen zu erklären.

Ich versuche hier ein Brainstorming durchzuführen, um herauszufinden, welche Analogie Sie finden würden, um einen solchen Kompromiss einer nicht-technischen Person zu beschreiben.


1
Ein neuer Ansatz besteht darin, die Komplexität des Modells von seiner Interpretierbarkeit zu entkoppeln, indem ein interpretierbares Modell überlagert wird. siehe github.com/slundberg/shap
Emre

Das ist super aufregend; SHAP sieht sehr cool und nützlich aus, danke, dass du @Emre geteilt hast.
TwinPenguins

Antworten:


1

Interessante Frage. Ich denke, dass Sie dies veranschaulichen können, indem Sie über verschiedene Anwendungsfälle nachdenken. Das einzige Beispiel, von dem ich gehört habe, dass es mir gefällt, sind Kreditentscheidungen für Kreditanträge. Das ist ein Algorithmus, aber aufgrund von Vorschriften kann es nicht streng "Black Box" sein. Die Entscheidung muss effektiv interpretierbar sein, da die Bank Ihnen einen Grund für die Ablehnung des Kredits geben muss. Es gibt also sicherlich bessere Algen für Kredite, die ein binäres Ergebnis liefern können, aber möchten Sie, dass eine Bank Ihnen nur Ja oder Nein sagt?


1

Eine andere Frage, die Sie sich stellen können, ist, ob Sie ein Geschäftsziel haben, ein System so zu verstehen, dass Sie Informationen über die Eingaben und ihre Beziehung erhalten und wie sich Änderungen an diesen Eingaben auf Ihr Ergebnis auswirken (Vorhersage).

Ein aktuelles Beispiel für ein Problem, an dem ich gearbeitet habe und das in diesen Fall fällt, ist die Vorhersage der Anzahl der Marktführer pro Monat (Woche, Tag) unter Verwendung der Ausgaben nach Kanälen (TV, Radio, Digital). Hier bestand das Ziel nicht nur darin, vorherzusagen, wie viele Leads bei bestimmten Ausgaben generiert werden würden, sondern auch einen Rahmen zu haben, mit dem die Lead-Generierung im Hinblick auf die Ausgabenverteilung optimiert werden kann (dh was ist die kostengünstigste Verteilung der Ausgaben über TV, Radio und Fernsehen? digital, um die größte Anzahl von Leads zu generieren). Aufgrund dieser Geschäftsanforderung hätte ein neuronales Netzwerk oder SVM unsere Ziele nicht erreicht, da sie zwar eine Vorhersage der Lead-Generierung geliefert hätten, aber kein Verständnis für die Eingaben (Ausgaben nach Kanälen) geliefert hätten.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.