tl; dr
- Was ist die empfohlene Methode zum Umgang mit
discrete
Daten bei der Erkennung von Anomalien? - Was ist die empfohlene Methode zum Umgang mit
categorical
Daten bei der Erkennung von Anomalien? - Diese Antwort schlägt vor, diskrete Daten zu verwenden, um nur die Ergebnisse zu filtern.
- Vielleicht den Kategoriewert durch die prozentuale Beobachtungswahrscheinlichkeit ersetzen?
Intro
Dies ist das erste Mal, dass ich hier etwas veröffentliche. Wenn also etwas technisch nicht korrekt erscheint, sei es in Bezug auf die Formatierung oder die Verwendung korrekter Definitionen, möchte ich wissen, was stattdessen hätte verwendet werden sollen.
Weiter.
Ich habe vor kurzem an der Maschinellen Lernklasse von Andrew Ng teilgenommen
Zur Erkennung von Anomalien wurde uns beigebracht, die Normal- / Gauß-Verteilungsparameter für ein bestimmtes Merkmal / eine bestimmte Variable innerhalb eines Datensatzes zu bestimmen und dann die Wahrscheinlichkeit eines ausgewählten Satzes von Trainingsbeispielen / Beobachtungswerten zu bestimmen, wenn dieser bestimmte Wert gegeben ist Gaußsche Verteilung und dann das Produkt der Wahrscheinlichkeiten der Merkmale.
Methode
Wähle Merkmale / Variablen, die deiner Meinung nach die fragliche Aktivität erklären: { x 1 , x 2 , … , x i }
Passen Sie die Parameter des Gaußschen für jedes Merkmal an:
Dies gibt uns die Methode, mit der wir feststellen können, ob ein Beispiel einer weiteren Prüfung bedarf.
Meine Fragen)
Dies scheint für kontinuierliche Variablen / Merkmale in Ordnung zu sein, diskrete Daten werden jedoch nicht angesprochen.
Fragen: (aktualisiert: 24.11.2015)
Gibt es insgesamt eine andere Methode, die berücksichtigt, was ich hier frage, um weiter zu recherchieren / lernen zu können?- Was ist die empfohlene Methode zum Umgang mit
discrete
Daten bei der Erkennung von Anomalien? - Was ist die empfohlene Methode zum Umgang mit
categorical
Daten bei der Erkennung von Anomalien?
Bearbeiten: 2017-05-03
- Diese Antwort schlägt vor, diskrete Daten zu verwenden, um nur die Ergebnisse zu filtern.
- Vielleicht den Kategoriewert durch die prozentuale Beobachtungswahrscheinlichkeit ersetzen?