Als «classification» getaggte Fragen

Die statistische Klassifizierung ist das Problem der Identifizierung der Teilpopulation, zu der neue Beobachtungen gehören, bei der die Identität der Teilpopulation unbekannt ist, auf der Grundlage eines Trainingssatzes von Daten, die Beobachtungen enthalten, deren Teilpopulation bekannt ist. Daher zeigen diese Klassifikationen ein variables Verhalten, das statistisch untersucht werden kann.


5
Welchen Einfluss hat die Erhöhung der Trainingsdaten auf die Genauigkeit des Gesamtsystems?
Kann mir jemand mit möglichen Beispielen zusammenfassen, in welchen Situationen eine Erhöhung der Trainingsdaten das Gesamtsystem verbessert? Wann stellen wir fest, dass das Hinzufügen weiterer Trainingsdaten möglicherweise zu einer Überanpassung der Daten führt und die Testdaten nicht genau genug sind? Dies ist eine sehr unspezifische Frage. Wenn Sie sie jedoch …

2
Kombinieren Sie Klassifikatoren, indem Sie eine Münze werfen
Ich lerne einen maschinellen Lernkurs und die Vorlesungsfolien enthalten Informationen, die dem empfohlenen Buch widersprechen. Das Problem ist folgendes: Es gibt drei Klassifikatoren: Klassifikator A, der eine bessere Leistung im unteren Bereich der Schwellenwerte bietet, Klassifikator B, der eine bessere Leistung im höheren Bereich der Schwellenwerte bietet, Klassifikator C was …

4
Einstufung mit Tall Fat-Daten
Ich muss auf meinem Laptop einen linearen Klassifikator mit hunderttausenden Datenpunkten und etwa zehntausenden Funktionen trainieren. Welche Möglichkeiten habe ich? Was ist der Stand der Technik für diese Art von Problem? Der stochastische Gradientenabstieg scheint eine vielversprechende Richtung zu sein, und ich bin der Meinung, dass dies auf dem neuesten …

2
Eine zunehmende Anzahl von Merkmalen führt zu einer Verringerung der Genauigkeit, jedoch zu einer Erhöhung des Vorlaufs / Rückrufs
Ich bin neu im maschinellen Lernen. Im Moment benutze ich einen Naive Bayes (NB) Klassifikator, um kleine Texte in 3 Klassen mit NLTK und Python als positiv, negativ oder neutral zu klassifizieren. Nach einigen Tests mit einem Datensatz von 300.000 Instanzen (16.924 positive, 7.477 negative und 275.599 neutrale) stellte ich …

5
Was ist eine gute Ressource, die einen Vergleich der Vor- und Nachteile verschiedener Klassifikatoren beinhaltet?
Was ist der beste 2-Klassen-Klassifikator? Ja, ich denke, das ist die Millionen-Dollar-Frage, und ja, mir ist das No-Free-Lunch-Theorem bekannt , und ich habe auch die vorherigen Fragen gelesen: Was ist der beste 2-Klassen-Klassifikator für Ihre Anwendung? und schlechtester Klassifikator Dennoch bin ich daran interessiert, mehr zu diesem Thema zu lesen. …

4
Statistische Ähnlichkeit von Zeitreihen
Angenommen, man hat eine Zeitreihe, aus der man verschiedene Messungen wie Periode, Maximum, Minimum, Durchschnitt usw. durchführen und daraus eine Modell-Sinuswelle mit denselben Attributen erstellen kann. Gibt es statistische Ansätze, die man quantifizieren könnte? Wie genau stimmen die tatsächlichen Daten mit dem angenommenen Modell überein? Die Anzahl der Datenpunkte in …



3
Bedeuten größere Koeffizienten für lineare Klassifikatoren wichtigere Merkmale?
Ich bin ein Software-Ingenieur, der am maschinellen Lernen arbeitet. Nach meinem Verständnis bilden lineare Regression (wie OLS) und lineare Klassifikation (wie logistische Regression und SVM) eine Vorhersage auf der Grundlage eines inneren Produkts zwischen trainierten Koeffizienten und Merkmalsvariablen :w⃗ w→\vec{w}x⃗ x→\vec{x} y^=f(w⃗ ⋅x⃗ )=f(∑iwixi)y^=f(w→⋅x→)=f(∑iwixi) \hat{y} = f(\vec{w} \cdot \vec{x}) = …

2
Welches Maß an Trainingsfehlern für zufällige Wälder?
Ich passe zurzeit zufällige Gesamtstrukturen für ein Klassifizierungsproblem mit dem randomForestPaket in R an und bin nicht sicher, wie Trainingsfehler für diese Modelle gemeldet werden sollen. Mein Trainingsfehler liegt nahe bei 0%, wenn ich ihn mit Vorhersagen berechne, die ich mit dem Befehl erhalte: predict(model, data=X_train) Wo X_trainsind die Trainingsdaten? …


2
Was ist "Grundlinie" in der Präzisionsrückrufkurve
Ich versuche, die Genauigkeits-Rückrufkurve zu verstehen. Ich verstehe, was Präzision und Rückruf sind, aber das, was ich nicht verstehe, ist der "Grundlinien" -Wert. Ich habe diesen Link gelesen https://classeval.wordpress.com/introduction/introduction-to-the-precision-recall-plot/ und ich verstehe den in "Eine Präzisions-Rückruf-Kurve eines perfekten Klassifikators" gezeigten Grundlinienteil nicht. Was macht es? und wie berechnen wir das? …

1
Tiefe eines Entscheidungsbaums
Da der Entscheidungsbaumalgorithmus bei jedem Schritt ein Attribut aufteilt, entspricht die maximale Tiefe eines Entscheidungsbaums der Anzahl der Attribute der Daten. Ist das richtig?

3
Intuition für Support Vector Machines und die Hyperebene
In meinem Projekt möchte ich ein logistisches Regressionsmodell zur Vorhersage der binären Klassifikation (1 oder 0) erstellen. Ich habe 15 Variablen, von denen 2 kategorisch sind, während der Rest eine Mischung aus kontinuierlichen und diskreten Variablen ist. Um ein logistisches Regressionsmodell anzupassen, wurde mir geraten, die lineare Trennbarkeit entweder mit …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.