Als «classification» getaggte Fragen

Die statistische Klassifizierung ist das Problem der Identifizierung der Teilpopulation, zu der neue Beobachtungen gehören, bei der die Identität der Teilpopulation unbekannt ist, auf der Grundlage eines Trainingssatzes von Daten, die Beobachtungen enthalten, deren Teilpopulation bekannt ist. Daher zeigen diese Klassifikationen ein variables Verhalten, das statistisch untersucht werden kann.

2
Klassifizierung mit teilweise „unbekannten“ Daten
Angenommen, ich möchte einen Klassifizierer lernen, der einen Vektor von Zahlen als Eingabe verwendet und eine Klassenbezeichnung als Ausgabe gibt. Meine Trainingsdaten bestehen aus einer großen Anzahl von Eingabe-Ausgabe-Paaren. Wenn ich jedoch einige neue Daten teste, sind diese Daten normalerweise nur teilweise vollständig. Wenn der Eingabevektor beispielsweise die Länge 100 …

1
Berechnungsschwelle für Mindestrisikoklassifikator?
Angenommen, zwei Klassen C1C1C_1 und haben ein Attribut und die Verteilung und . wenn wir gleich vor für folgende Kostenmatrix haben:C2C2C_2xxxN(0,0.5)N(0,0.5) \cal{N} (0, 0.5)N(1,0.5)N(1,0.5) \cal{N} (1, 0.5)P(C1)=P(C2)=0.5P(C1)=P(C2)=0.5P(C_1)=P(C_2)=0.5 L=[010.50]L=[00.510]L= \begin{bmatrix} 0 & 0.5 \\ 1 & 0 \end{bmatrix} Warum ist der Schwellenwert für den Klassifikator für das minimale Risiko (Kosten)?x0&lt;0.5x0&lt;0,5x_0 < …


3
Konfidenzintervall für die kreuzvalidierte Klassifizierungsgenauigkeit
Ich arbeite an einem Klassifizierungsproblem, das eine Ähnlichkeitsmetrik zwischen zwei eingegebenen Röntgenbildern berechnet. Wenn die Bilder von derselben Person stammen (Bezeichnung "rechts"), wird eine höhere Metrik berechnet. Eingabebilder von zwei verschiedenen Personen (Bezeichnung "falsch") führen zu einer niedrigeren Metrik. Ich habe eine geschichtete 10-fache Kreuzvalidierung verwendet, um die Wahrscheinlichkeit einer …


2
Zeitreihenklassifikation - sehr schlechte Ergebnisse
Ich arbeite an einem Zeitreihenklassifizierungsproblem, bei dem die Eingabe Zeitreihen-Sprachnutzungsdaten (in Sekunden) für die ersten 21 Tage eines Mobiltelefonkontos sind. Die entsprechende Zielvariable ist, ob dieses Konto im Bereich von 35 bis 45 Tagen gekündigt wurde oder nicht. Es handelt sich also um ein binäres Klassifizierungsproblem. Ich erhalte sehr schlechte …



2
Messungen der Klassentrennbarkeit bei Klassifizierungsproblemen
Ein Beispiel für ein gutes Maß für die Klassentrennbarkeit bei Lernenden mit linearer Diskriminanz ist das lineare Diskriminanzverhältnis von Fisher. Gibt es andere nützliche Metriken, um festzustellen, ob Feature-Sets eine gute Klassentrennung zwischen Zielvariablen bieten? Insbesondere bin ich daran interessiert, gute multivariate Eingabeattribute zur Maximierung der Zielklassentrennung zu finden, und …

2
Verwenden von Adaboost mit SVM zur Klassifizierung
Ich weiß, dass Adaboost versucht, einen starken Klassifikator unter Verwendung einer linearen Kombination einer Reihe schwacher Klassifikatoren zu erzeugen. Ich habe jedoch einige Artikel gelesen, in denen darauf hingewiesen wird, dass Adaboost und SVMs unter bestimmten Bedingungen und in bestimmten Fällen harmonisch funktionieren (obwohl SVM ein starker Klassifikator ist) . …


1
Erweiterung von 2-Klassen-Modellen auf Mehrklassenprobleme
Dieses Dokument zu Adaboost enthält einige Vorschläge und Codes (Seite 17) für die Erweiterung von 2-Klassen-Modellen auf Probleme der K-Klasse. Ich möchte diesen Code so verallgemeinern, dass ich problemlos verschiedene 2-Klassen-Modelle anschließen und die Ergebnisse vergleichen kann. Da die meisten Klassifizierungsmodelle über eine Formelschnittstelle und eine predictMethode verfügen, sollte ein …

3
Klassifizierungsmodell für die Vorhersage von Filmbewertungen
Ich bin etwas neu im Data Mining und arbeite an einem Klassifizierungsmodell für die Vorhersage von Filmbewertungen. Ich habe Datensätze aus der IMDB gesammelt und plane, für mein Modell Entscheidungsbäume und Ansätze für den nächsten Nachbarn zu verwenden. Ich möchte wissen, welches frei verfügbare Data Mining-Tool die von mir benötigte …

2
Einen Klassifikationsbaum (in rpart) in ein Regelwerk organisieren?
Gibt es eine Möglichkeit, nach Erstellung eines komplexen Klassifizierungsbaums mit rpart (in R) die für jede Klasse erstellten Entscheidungsregeln zu organisieren? Anstatt also einen riesigen Baum zu bekommen, bekommen wir eine Reihe von Regeln für jede der Klassen? (Wenn das so ist, wie?) Hier ist ein einfaches Codebeispiel, um Beispiele …
11 r  classification  cart  rpart 

3
Gibt es Bibliotheken für CART-ähnliche Methoden, die spärliche Prädiktoren und Antworten verwenden?
Ich arbeite mit einigen großen Datenmengen unter Verwendung des gbm-Pakets in R. Sowohl meine Prädiktormatrix als auch mein Antwortvektor sind ziemlich spärlich (dh die meisten Einträge sind Null). Ich hatte gehofft, Entscheidungsbäume mit einem Algorithmus zu erstellen, der diese Spärlichkeit ausnutzt, wie hier ). In diesem Artikel haben, wie in …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.