Benötige ich eine Klassifizierung oder Regression, um die Verfügbarkeit eines Benutzers bei bestimmten Funktionen vorherzusagen?


9

Beim Studium der Data Mining-Methoden habe ich festgestellt, dass es zwei Hauptkategorien gibt:

  • Vorhersagemethoden:

    • Einstufung
    • Regression
  • Beschreibende Methoden:

    • Clustering
    • Assoziationsregeln

Da ich die Benutzerverfügbarkeit (Ausgabe) basierend auf Standort, Aktivität, Batteriestand (Eingabe für das Trainingsmodell) vorhersagen möchte, denke ich, dass es offensichtlich ist, dass ich "Vorhersagemethoden" wählen würde, aber jetzt kann ich scheinbar nicht zwischen wählen Klassifikation und Regression. Nach meinem bisherigen Verständnis kann die Klassifizierung mein Problem lösen, da die Ausgabe "verfügbar" oder "nicht verfügbar" ist.

Kann mir die Klassifizierung die Wahrscheinlichkeit (oder Wahrscheinlichkeit) geben, dass der Benutzer verfügbar oder nicht verfügbar ist?

Wie in der Ausgabe wäre nicht nur 0 (nicht verfügbar) oder 1 (für verfügbar), sondern es ist so etwas wie:

  • 80%. verfügbar
  • 20%. nicht verfügbar

Kann dieses Problem auch durch Regression gelöst werden?

8080%.20%.

Antworten:


6
  1. Ja. Mit der beliebten Softmax-Regression erhalten Sie beispielsweise eine Wahrscheinlichkeitsverteilung für jede Klasse.
  2. Ja. Softmax ist eine Regression über eine Reihe diskreter Klassen.

Wir können die Regression für die Klassifizierung verwenden. Die häufigste Strategie besteht darin, die wahrscheinlichste Klasse für die Vorhersage zu ermitteln.


1

Ja, Sie können entweder eine Klassifizierung oder eine Regression gemäß Ihrer Ausgabeanforderung verwenden.

Wenn Sie eine beschriftete Ausgabe wünschen, die entweder verfügbar oder nicht verfügbar ist, sollte die Klassifizierung verwendet werden.

Wenn Sie die Ausgabe in Form von% der Verfügbarkeit wünschen, sollte die Regression verwendet werden.


Können Sie dies mit Quellen von irgendwoher belegen?
Mithical

-1

Sie können die naive Bayes-Klassifizierung verwenden und die posterioren Wahrscheinlichkeiten unter Verwendung vorheriger Überzeugungen berechnen, oder die logistische Regression kann mit der Sigmoid-Funktion verwendet werden.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.