Als «classification» getaggte Fragen

Die statistische Klassifizierung ist das Problem der Identifizierung der Teilpopulation, zu der neue Beobachtungen gehören, bei der die Identität der Teilpopulation unbekannt ist, auf der Grundlage eines Trainingssatzes von Daten, die Beobachtungen enthalten, deren Teilpopulation bekannt ist. Daher zeigen diese Klassifikationen ein variables Verhalten, das statistisch untersucht werden kann.

1
Lineare Diskriminanzanalyse für
Ich studiere 'Einführung in das statistische Lernen' von James, Witten, Hastie, Tibshirani. Auf Seite 139 ihres Buches begannen sie mit der Einführung des Bayes-Theorems . ist keine mathematische Konstante, sondern bezeichnet die vorherige Wahrscheinlichkeit. In dieser Gleichung ist nichts seltsam. πpk(X)=P(Y=k|X=x)=πkfk(x)∑kl=1πlfl(x)pk(X)=P(Y=k|X=x)=πkfk(x)∑l=1kπlfl(x)p_k(X)=P(Y=k|X=x) = \dfrac{\pi_kf_k(x)}{\sum_{l=1}^k \pi_l f_l(x)}ππ\pi Das Buch behauptet, dass es …

1
Was ist der Unterschied zwischen "Goldstandard" und "Grundwahrheit"?
Was ist der Unterschied zwischen "Goldstandard" und "Grundwahrheit"? Die beiden Wiki-Artikel (dh Goldstandard und Grundwahrheit ) beziehen beide Konzepte in Bezug auf Modellgenauigkeit / -genauigkeit miteinander in Beziehung. Das ist eine Möglichkeit. Ich habe aber auch festgestellt, dass diese Konzepte synonym verwendet werden, wenn es um beschriftete Datensätze geht: In …

2
Reproduzieren Sie das Projektionsdiagramm der linearen Diskriminanzanalyse
Ich habe Probleme mit Projektionspunkten in der linearen Diskriminanzanalyse (LDA). Viele Bücher über multivariate statistische Methoden veranschaulichen die Idee der LDA anhand der folgenden Abbildung. Die Problembeschreibung lautet wie folgt. Zuerst müssen wir die Entscheidungsgrenze zeichnen, eine senkrechte Linie hinzufügen und dann Projektionen von Datenpunkten darauf zeichnen. Ich frage mich, …



1
Techniken zum inkrementellen Online-Lernen von Klassifikatoren für Stream-Daten
Welche Techniken könnten gut sein, um diesem abstrakten Problem zu begegnen? Sie haben einen Datenstrom eines kontinuierlichen Signals als einen von einem physischen Sensor. Dieses Signal hat reale (diskretisierte) Werte, kein Attribut; Suchtmerkmale (z. B. Leistung, Autokorrelation, Entropie) können extrahiert werden. Sie können einem Fenster des Signals eine Bezeichnung aus …

1
Kategorisierungs- / Segmentierungstechniken
Lassen Sie mich zunächst sagen, dass ich hier etwas überfordert bin. Wenn diese Frage also neu formuliert oder als Duplikat geschlossen werden muss, lassen Sie es mich bitte wissen. Es kann einfach sein, dass ich nicht das richtige Vokabular habe, um meine Frage auszudrücken. Ich arbeite an einer Bildverarbeitungsaufgabe, bei …

2
Scharnierverlust mit One-vs-All-Klassifikator
Ich betrachte derzeit die uneingeschränkte Urform des Ein-gegen-Alles-Klassifikators ∑i = 1N.ich∑k = 1 ,k ≠ yichN.K.L ( 1 + wk⋅ xich- wyich⋅ xich)∑ich=1N.ich∑k=1,k≠yichN.K.L.(1+wk⋅xich- -wyich⋅xich)\sum\limits_{i=1}^{N_I} \sum\limits_{k=1,\atop k \neq y_i}^{N_K} L(1+ \mathbf{w_k}\cdot\mathbf{x_i}-\mathbf{w_{y_i}}\cdot\mathbf{x_i}) wo N.ichN.ichN_I ist die Anzahl der Instanzen, ist die Anzahl der Klassen, ist die Anzahl der Merkmale, ist eine Datenmatrix, …

1
Wie werden zufällige Wälder und extrem zufällige Bäume unterschiedlich aufgeteilt?
Für zufällige Gesamtstrukturen teilen wir den Knoten nach Gini-Verunreinigung oder Entropie für eine Reihe von Merkmalen auf. Mit dem RandomForestClassifier in sklearn können wir wählen, ob wir das Gini-Kriterium oder das Entropy-Kriterium verwenden möchten. Was ich jedoch über Extra-Trees Classifier gelesen habe, ist ein zufälliger Wert für die Aufteilung (ich …





1
Codieren von kategorialen Merkmalen mit hoher Kardinalität (viele Kategorien), wenn sich die Merkmale in Bezug auf die Kardinalität stark unterscheiden
Ich habe Fragen zur Codierung kategorialer Features durchgesehen, konnte jedoch keine finden, die mein Problem diskutieren. Entschuldigung, wenn ich es verpasst habe. Nehmen wir an, wir haben einen Datensatz mit binären und nominalen Variablen von jeweils ungefähr gleicher Bedeutung. Die meisten Klassifizierer können sich nicht direkt mit kategorialen Typen befassen, …

1
Regressionsdefinition
Aus Wikipedia: Bei der statistischen Modellierung ist die Regressionsanalyse ein statistischer Prozess zur Schätzung der Beziehungen zwischen Variablen. Es enthält viele Techniken zum Modellieren und Analysieren mehrerer Variablen, wenn der Schwerpunkt auf der Beziehung zwischen einer abhängigen Variablen und einer oder mehreren unabhängigen Variablen (oder "Prädiktoren") liegt. Ist das nicht …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.