Als «categorical-data» getaggte Fragen

Kategoriale (auch nominelle) Daten können eine begrenzte Anzahl möglicher Werte annehmen, die als Kategorien bezeichnet werden. Kategoriale Werte "Label", sie "messen" nicht. Bitte verwenden Sie das Tag [Ordnungsdaten] für diskrete, aber geordnete Datentypen.

5
Wie lässt sich die Beziehung zwischen diskreten und kontinuierlichen Variablen am besten veranschaulichen?
Was ist der beste Weg, um eine Beziehung zwischen: kontinuierliche und diskrete Variable, zwei diskrete Variablen? Bisher habe ich Streudiagramme verwendet, um die Beziehung zwischen kontinuierlichen Variablen zu untersuchen. Bei diskreten Variablen werden die Datenpunkte jedoch in bestimmten Intervallen kumuliert. Somit könnte die Linie der besten Anpassung vorgespannt sein.


5
Neucodieren von kategorialen Variablen in numerische Variablen bei Verwendung von SVM oder Neural Network
Um SVM oder Neural Network zu verwenden, müssen kategoriale Variablen in numerische Variablen umgewandelt (kodiert) werden. In diesem Fall werden normalerweise 0-1 Binärwerte verwendet, wobei der k-te kategoriale Wert in (0,0, .. ., 1,0, ... 0) (1 ist auf der k-ten Position). Gibt es andere Methoden, um dies zu tun, …


2
Interpretation von Betas bei mehreren kategorialen Variablen
Ich verstehe das Konzept, dass der Mittelwert ist, wenn die kategoriale Variable gleich 0 ist (oder die Referenzgruppe ist), was die Endinterpretation ergibt, dass der Regressionskoeffizient die Differenz im Mittel der beiden Kategorien ist. Selbst bei> 2 Kategorien würde ich annehmen, dass jede den Unterschied zwischen dem Mittelwert dieser Kategorie …

4
Nichttransitivität der Korrelation: Korrelationen zwischen Geschlecht und Gehirngröße sowie zwischen Gehirngröße und IQ, aber keine Korrelation zwischen Geschlecht und IQ
In einem Blog habe ich folgende Erklärung gefunden und möchte mehr über die Nicht-Transitivität der Korrelation erfahren: Wir haben die folgenden unbestreitbaren Tatsachen: Im Durchschnitt gibt es einen Unterschied im Gehirnvolumen zwischen Männern und Frauen Es gibt eine Korrelation zwischen dem IQ und der Gehirngröße. Die Korrelation beträgt 0,33 und …

1
Umgang mit einer SVM mit kategorialen Attributen
Ich habe einen Raum von 35 Dimensionen (Attribute). Mein analytisches Problem ist eine einfache Klassifizierung. Von 35 Dimensionen sind mehr als 25 kategorial und jedes Attribut akzeptiert mehr als 50 Werttypen. In diesem Szenario funktioniert die Einführung einer Dummy-Variablen auch für mich nicht. Wie kann ich eine SVM auf einem …

5
Welche zusammenfassenden Statistiken sind für kategoriale oder qualitative Variablen zu verwenden?
Um dies zu verdeutlichen, beziehe ich mich auf die Bereiche Mittelwert, Medianquartil, Varianz und Standardabweichung. Ist es bei der Zusammenfassung einer kategorialen oder qualitativen Univariate unter Berücksichtigung von Nominal- und Ordinalfällen sinnvoll, den Mittelwert, den Median, die Quartilbereiche, die Varianz und die Standardabweichung zu ermitteln? Wenn ja, ist es anders, …

2
Anomalieerkennung mit Dummy-Funktionen (und anderen diskreten / kategorialen Funktionen)
tl; dr Was ist die empfohlene Methode zum Umgang mit discreteDaten bei der Erkennung von Anomalien? Was ist die empfohlene Methode zum Umgang mit categoricalDaten bei der Erkennung von Anomalien? Diese Antwort schlägt vor, diskrete Daten zu verwenden, um nur die Ergebnisse zu filtern. Vielleicht den Kategoriewert durch die prozentuale …

1
Wie teste ich die statistische Signifikanz für kategoriale Variablen in der linearen Regression?
Wenn ich in einer linearen Regression eine kategoriale Variable habe ... woher weiß ich, welche statistische Bedeutung die kategoriale Variable hat? Nehmen wir an, der Faktor hat 10 Stufen ... es gibt 10 verschiedene resultierende t-Werte unter dem Dach einer Faktorvariablen ...X 1X1X1X_1X1X1X_1 Es scheint mir, dass die statistische Signifikanz …

3
Ist das Erstellen eines Klassifikators für mehrere Klassen besser als das Erstellen mehrerer binärer Klassifikatoren?
Ich muss URLs in Kategorien einteilen. Angenommen, ich habe 15 Kategorien, für die ich vorhabe, jede URL auf null zu setzen. Ist ein 15-Wege-Klassifikator besser? Wobei ich 15 Labels habe und Features für jeden Datenpunkt generiere. Oder bauen Sie 15 binäre Klassifizierer auf, sagen Sie: Film oder Nicht-Film, und verwenden …

1
Wie behandelt man kategoriale Prädiktoren in LASSO?
Ich führe ein LASSO mit einigen kategorialen und einigen kontinuierlichen Variablenprädiktoren. Ich habe eine Frage zu den kategorialen Variablen. Der erste Schritt, den ich verstehe, besteht darin, jeden von ihnen in Dummies zu zerlegen, sie für eine faire Bestrafung zu standardisieren und dann zurückzugehen. Für die Behandlung der Dummy-Variablen ergeben …

2
Qualitative Variablencodierung in der Regression führt zu „Singularitäten“
Ich habe eine unabhängige Variable namens "Qualität"; Diese Variable hat 3 Antwortmodalitäten (schlechte Qualität; mittlere Qualität; hohe Qualität). Ich möchte diese unabhängige Variable in meine multiple lineare Regression einführen. Wenn ich eine binäre unabhängige Variable habe (Dummy-Variable, ich kann 0/ codieren 1), ist es einfach, sie in ein Modell mit …


2
Merkmalsbedeutung bei Dummy-Variablen
Ich versuche zu verstehen, wie ich die Feature-Wichtigkeit einer kategorialen Variablen ermitteln kann, die in Dummy-Variablen zerlegt wurde. Ich benutze scikit-learn, das kategoriale Variablen für Sie nicht so behandelt, wie es R oder H2O tun. Wenn ich eine kategoriale Variable in Dummy-Variablen zerlege, erhalte ich separate Feature-Wichtigkeiten pro Klasse in …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.