Es gibt viele - und was am besten funktioniert, hängt von den Daten ab. Es gibt auch viele Möglichkeiten zu betrügen. Beispielsweise können Sie eine Wahrscheinlichkeitskalibrierung an den Ausgängen jedes Klassifikators durchführen, der einen Anschein einer Punktzahl ergibt (dh ein Skalarprodukt zwischen dem Gewichtungsvektor und der Eingabe). Das bekannteste Beispiel hierfür ist die Plattsche Skalierung.
Es geht auch um die Form des zugrunde liegenden Modells. Wenn Sie polynomielle Interaktionen mit Ihren Daten haben, kann die Vanilla Logistic Regression diese nicht gut modellieren. Sie können jedoch eine Kernversion der logistischen Regression verwenden, damit das Modell besser zu den Daten passt. Dies erhöht normalerweise die "Güte" der Wahrscheinlichkeitsausgaben, da Sie auch die Genauigkeit des Klassifikators verbessern.
Im Allgemeinen verwenden die meisten Modelle, die Wahrscheinlichkeiten angeben, normalerweise eine logistische Funktion, sodass ein Vergleich schwierig sein kann. In der Praxis funktioniert das meistens, Bayes-Netzwerke sind eine Alternative. Naive Bayes geht von einer zu simplen Annahme aus, als dass ihre Wahrscheinlichkeiten gut wären - und das lässt sich bei einem Datensatz mit angemessener Größe leicht beobachten.
Am Ende ist es normalerweise einfacher, die Qualität Ihrer Wahrscheinlichkeitsschätzungen zu verbessern, indem Sie das Modell auswählen, das die Daten besser darstellen kann. In diesem Sinne spielt es keine Rolle, wie Sie die Wahrscheinlichkeiten erhalten. Wenn Sie mit einer logistischen Regression eine Genauigkeit von 70% und mit einer SVM eine Genauigkeit von 98% erzielen, können Sie mit einer Wahrscheinlichkeit von nur "vollem Vertrauen" die Ergebnisse mit den meisten Bewertungsmethoden "verbessern", auch wenn es sich nicht wirklich um Wahrscheinlichkeiten handelt (und Dann können Sie die zuvor erwähnte Kalibrierung durchführen, um sie tatsächlich zu verbessern.
Die gleiche Frage im Zusammenhang mit der Unfähigkeit, einen genauen Klassifikator zu erhalten, ist interessanter, aber ich bin nicht sicher, ob jemand in einem solchen Szenario studiert / verglichen hat.