Es ist tatsächlich möglich, Wahrscheinlichkeiten aus einer Support Vector Machine herauszuholen, die möglicherweise nützlicher und interpretierbarer sind als ein beliebiger "Score" -Wert. Hierfür gibt es einige Ansätze: Ein vernünftiger Ausgangspunkt ist Platt (1999) .
Die meisten SVM-Pakete / -Bibliotheken implementieren so etwas (z. B. bewirkt die Option -b 1, dass LibSVM Wahrscheinlichkeiten erzeugt). Wenn Sie Ihre eigenen Rollen spielen möchten, sollten Sie sich bewusst sein, dass es einige potenzielle numerische Probleme gibt, die in dieser Notiz von Lin, Lin und Weng (2007) zusammengefasst sind . Sie bieten auch einen Pseudocode, der ebenfalls hilfreich sein kann.
Bearbeiten als Antwort auf Ihren Kommentar : Es ist mir etwas unklar, warum Sie eine Punktzahl einer Wahrscheinlichkeit vorziehen, zumal Sie die Wahrscheinlichkeit mit minimalem zusätzlichen Aufwand erhalten können. Trotzdem scheinen die meisten Wahrscheinlichkeitsberechnungen aus der Entfernung zwischen dem Punkt und der Hyperebene abgeleitet zu sein. Wenn Sie sich Abschnitt 2 des Platt-Papiers ansehen, geht er die Motivation durch und sagt:
Die klassenbedingten Dichten zwischen den Rändern sind offensichtlich exponentiell. Die Bayes-Regel für zwei Exponentiale schlägt vor, eine parametrische Form eines Sigmoid zu verwenden:
Dieses Sigmoidmodell entspricht der Annahme, dass die Ausgabe erfolgt der SVM ist proportional zur Log-Wahrscheinlichkeit eines positiven Trainingsbeispiels. [MK: wurde an anderer Stelle als SVM-Rohausgabe definiert].
P(y=1|f)=11+exp(Af+B)
f
Der Rest des Methodenabschnitts beschreibt, wie die und Parameter dieses Sigmoid angepasst werden. In der Einleitung (Abschnitt 1.0 und 1.1) geht Platt auf einige andere Ansätze von Vapnik, Wahba und Hasti & Tibshirani ein. Diese Methoden verwenden auch so etwas wie den Abstand zur Hyperebene, der auf verschiedene Weise manipuliert wird. Dies alles scheint darauf hinzudeuten, dass der Abstand zur Hyperebene einige nützliche Informationen enthält. Ich denke, Sie könnten den Rohabstand als (nichtlineares) Maß für das Vertrauen verwenden.AB