Als «unbalanced-classes» getaggte Fragen

Daten, die in diskreten Kategorien oder * Klassen * organisiert sind, können für bestimmte Analysen Probleme bereiten, wenn die Anzahl der Beobachtungen ( ), die zu jeder Klasse gehören, über Klassen hinweg nicht konstant ist. Klassen mit ungleichem sind * unausgeglichen *. nn


2
Die Reihenfolge der Variablen in ANOVA ist wichtig, nicht wahr?
Ist es richtig zu verstehen, dass die Reihenfolge, in der Variablen in einer multifaktoriellen ANOVA angegeben werden, einen Unterschied macht, aber dass die Reihenfolge bei einer multiplen linearen Regression keine Rolle spielt? Nehmen wir also ein Ergebnis wie den gemessenen Blutverlust y und zwei kategoriale Variablen an Adenoidektomie-Methode a , …

2
Testen der Klassifizierung von überabgetasteten Ungleichgewichtsdaten
Ich arbeite an stark unausgeglichenen Daten. In der Literatur werden verschiedene Methoden verwendet, um die Daten durch erneutes Abtasten (Über- oder Unterabtasten) neu abzugleichen. Zwei gute Ansätze sind: SMOTE: Synthetic Minority-Überabtastung ( SMOTE ) ADASYN: Adaptiver Ansatz zur synthetischen Probenahme für unausgewogenes Lernen ( ADASYN ) Ich habe ADASYN implementiert, …

2
Leidet die GBM-Klassifizierung unter unausgewogenen Klassengrößen?
Ich habe es mit einem Problem der überwachten binären Klassifizierung zu tun. Ich möchte das GBM-Paket verwenden, um Personen als nicht infiziert / infiziert zu klassifizieren. Ich habe 15-mal mehr nicht infizierte als infizierte Personen. Ich habe mich gefragt, ob GBM-Modelle unter unausgeglichenen Klassengrößen leiden? Ich habe keine Referenzen gefunden, …


3
Vorschläge für kostensensitives Lernen in einem sehr unausgewogenen Umfeld
Ich habe einen Datensatz mit einigen Millionen Zeilen und ~ 100 Spalten. Ich möchte ungefähr 1% der Beispiele im Datensatz erkennen, die zu einer gemeinsamen Klasse gehören. Ich habe eine minimale Genauigkeitsbeschränkung, aber aufgrund der sehr asymmetrischen Kosten bin ich nicht besonders an einem bestimmten Rückruf interessiert (solange mir nicht …

3
SVM für unausgeglichene Daten
Ich möchte versuchen, Support Vector Machines (SVMs) für mein Dataset zu verwenden. Bevor ich das Problem versuchte, wurde ich gewarnt, dass SVMs bei extrem unausgeglichenen Daten keine gute Leistung bringen. In meinem Fall kann ich bis zu 95-98% 0 und 2-5% 1 haben. Ich habe versucht, Ressourcen zu finden, bei …



1
Unterschreitet die Maximierung der Genauigkeit bei über- / unterabgetasteten unsymmetrischen Klassen die Minimierung der Fehlklassifizierungskosten?
Zunächst möchte ich einige gängige Layouts beschreiben, die in Data Mining-Büchern verwendet werden, um den Umgang mit unsymmetrischen Datasets zu erläutern . Normalerweise heißt der Hauptabschnitt Unbalanced Datasets und deckt diese beiden Unterabschnitte ab: Cost-Sensitive Classification und Sampling Techniques. Es scheint, dass Sie bei einem Problem mit einer seltenen Klasse …





3
Welche Verlustfunktion sollte man verwenden, um einen binären Klassifikator mit hoher Präzision oder hohem Rückruf zu erhalten?
Ich versuche, einen Detektor für Objekte zu erstellen, die sehr selten vorkommen (in Bildern), und plane, einen binären CNN-Klassifikator zu verwenden, der in einem Schiebe- / Größenänderungsfenster angewendet wird. Ich habe ausgeglichene 1: 1-Positiv-Negativ-Trainings- und Testsätze erstellt (ist es in einem solchen Fall übrigens richtig?), Und der Klassifikator ist in …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.