Als «classification» getaggte Fragen

Eine Instanz des überwachten Lernens, die die Kategorie oder Kategorien identifiziert, zu denen eine neue Instanz des Datensatzes gehört.

3
Frühzeitiger Stopp bei Validierungsverlust oder Genauigkeit?
Ich trainiere derzeit ein neuronales Netzwerk und kann mich nicht entscheiden, welches zur Implementierung meiner Early-Stop-Kriterien verwendet werden soll: Validierungsverlust oder Metriken wie Genauigkeit / f1score / auc / was auch immer auf dem Validierungssatz berechnet. Bei meinen Recherchen stieß ich auf Artikel, die beide Standpunkte verteidigten. Keras scheint standardmäßig …

1
Unausgeglichene Daten, die zu einer Fehlklassifizierung des Datensatzes mit mehreren Klassen führen
Ich arbeite an einer Textklassifizierung mit 39 Kategorien / Klassen und 8,5 Millionen Datensätzen. (In Zukunft werden Daten und Kategorien zunehmen). Struktur oder Format meiner Daten ist wie folgt. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 Storage:128 GB, RAM:4 …


4
Klassifizieren Sie multivariate Zeitreihen
Ich habe einen Datensatz, der aus Zeitreihen (8 Punkte) mit ungefähr 40 Dimensionen besteht (also ist jede Zeitreihe 8 mal 40). Die entsprechende Ausgabe (die möglichen Ergebnisse für die Kategorien) ist entweder 0 oder 1. Was wäre der beste Ansatz, um einen Klassifikator für Zeitreihen mit mehreren Dimensionen zu entwerfen? …

2
Klassifikation von Vektorsequenzen
Mein Datensatz besteht aus Vektorsequenzen. Jeder Vektor hat 50 reelle Dimensionen. Die Anzahl der Vektoren in einer Sequenz reicht von 3-5 bis 10-15. Mit anderen Worten ist die Länge einer Sequenz nicht festgelegt. Einige der Sequenzen (keine Vektoren!) Sind mit einem Klassenlabel versehen. Meine Aufgabe ist es, einen Klassifikator zu …


1
Relationales Data Mining ohne ILP
Ich habe einen riesigen Datensatz aus einer relationalen Datenbank, für den ich ein Klassifizierungsmodell erstellen muss. Normalerweise würde ich für diese Situation die induktive Logikprogrammierung (ILP) verwenden, aber aufgrund besonderer Umstände kann ich das nicht tun. Die andere Möglichkeit, dies in Angriff zu nehmen, besteht darin, zu versuchen, die Werte …

4
Schlagen Sie Trainingsdatensätze für Textklassifizierer vor
Mit welchen frei verfügbaren Datensätzen kann ich einen Textklassifizierer trainieren? Wir versuchen, das Engagement unserer Benutzer zu verbessern, indem wir ihm den verwandtesten Inhalt empfehlen. Daher dachten wir, wenn wir unseren Inhalt anhand einer vordefinierten Worttasche klassifizieren, können wir ihm empfehlen, Inhalte zu nutzen, indem wir sein Feedback zu einer …


1
Kann das Vertrauen in Trainingsetiketten verwendet werden, um die Vorhersagegenauigkeit zu verbessern?
Ich habe Trainingsdaten, die mit Binärwerten gekennzeichnet sind. Ich habe auch das Vertrauen jedes dieser Etiketten gesammelt, dh 0,8 Vertrauen würde bedeuten, dass 80% der menschlichen Etikettierer diesem Etikett zustimmen. Ist es möglich, diese Vertrauensdaten zu verwenden, um die Genauigkeit meines Klassifikators zu verbessern? Würde folgendes funktionieren? 1a) Wenn das …


5
Was sind hilfreiche Anmerkungswerkzeuge (falls vorhanden)?
Ich suche nach Tools, mit denen ich und mein Team Trainingssätze kommentieren können. Ich arbeite in einer Umgebung mit großen Datenmengen, von denen einige un- oder halbstrukturiert sind. In vielen Fällen gibt es Registrierungen, die helfen, eine fundierte Wahrheit zu finden. In vielen Fällen wird jedoch ein kuratierter Satz benötigt, …

2
Wie verwende ich Cohens Kappa als Bewertungsmetrik in GridSearchCV in Scikit Learn?
Ich habe ein Klassenungleichgewicht im Verhältnis 1:15, dh eine sehr niedrige Ereignisrate. Um die Abstimmungsparameter von GBM in Scikit Learn auszuwählen, möchte ich Kappa anstelle der F1-Punktzahl verwenden. Mein Verständnis ist, dass Kappa eine bessere Metrik als die F1-Punktzahl für das Klassenungleichgewicht ist. Aber ich konnte Kappa als Evaluierungsmetrik in …

1
Kategorisierung von Ansätzen zum Umgang mit unausgeglichenen Klassen
Was ist der beste Weg, um die Ansätze zu kategorisieren, die entwickelt wurden, um das Problem der Ungleichgewichtsklassen zu lösen? Dieser Artikel kategorisiert sie in: Vorverarbeitung: umfasst Oversampling, Undersampling und Hybridmethoden, Kostensensitives Lernen: Umfasst direkte Methoden und Meta-Lernen, das letztere weiter in Schwellenwerte und Stichproben unterteilt. Ensemble-Techniken: Umfasst kostensensitive Ensembles …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.