Ich habe andere Themen zu partiellen Abhängigkeitsdiagrammen durchgelesen und die meisten davon beziehen sich darauf, wie Sie sie tatsächlich mit verschiedenen Paketen plotten, und nicht darauf, wie Sie sie genau interpretieren können.
Ich habe eine ganze Reihe von partiellen Abhängigkeitsplots gelesen und erstellt. Ich weiß, dass sie die marginale Auswirkung einer Variablen auf die Funktion ƒS (χS) mit der durchschnittlichen Auswirkung aller anderen Variablen (χc) aus meinem Modell messen. Höhere y-Werte bedeuten, dass sie einen größeren Einfluss auf die genaue Vorhersage meiner Klasse haben. Mit dieser qualitativen Interpretation bin ich jedoch nicht zufrieden.
Mein Modell (Random Forest) sagt zwei diskrete Klassen voraus. "Ja Bäume" und "Nein Bäume". TRI ist eine Variable, die sich als gute Variable dafür erwiesen hat.
Was ich zu denken begann, ist, dass der Y-Wert eine Wahrscheinlichkeit für eine korrekte Klassifizierung anzeigt. Beispiel: y (0,2) zeigt, dass TRI-Werte von> ~ 30 eine 20% ige Chance haben, eine True Positive-Klassifizierung korrekt zu identifizieren.
Wo umgekehrt
y (-0,2) zeigt, dass TRI-Werte von <~ 15 eine 20% ige Chance haben, eine True-Negative-Klassifikation korrekt zu identifizieren.
Allgemeine Interpretationen, die in der Literatur gemacht werden, würden so klingen: "Werte größer als TRI 30 beginnen einen positiven Einfluss auf die Klassifizierung in Ihrem Modell zu haben." Es klingt so vage und sinnlos für eine Handlung, die möglicherweise so viel über Ihre Daten aussagt.
Außerdem werden alle meine Diagramme auf der y-Achse im Bereich von -1 bis 1 begrenzt. Ich habe andere Diagramme mit -10 bis 10 usw. gesehen. Ist dies eine Funktion der Anzahl der Klassen, die Sie vorhersagen möchten?
Ich habe mich gefragt, ob jemand mit diesem Problem sprechen kann. Zeigen Sie mir vielleicht, wie ich diese Handlungen oder Literatur interpretieren sollte, die mir helfen können. Vielleicht lese ich zu weit?
Ich habe die Elemente des statistischen Lernens sehr gründlich gelesen: Data Mining, Inferenz und Vorhersage, und es war ein guter Ausgangspunkt, aber das war es auch schon.