Als «categorical-encoding» getaggte Fragen

Darstellung kategorialer Variablen als Sätze numerischer Variablen. In vielen Arten von Analysen erforderlich, damit sie kategoriale Daten verarbeiten können. Ein häufiges Beispiel ist die Verwendung eines kategorialen Prädiktors in Regression / ANOVA über Dummy-Codierung, Effektcodierung, Helmert-Codierung, benutzerdefinierte Kontraste usw.


3
Indikatorvariable für Binärdaten: {-1,1} vs {0,1}
Ich bin an behandlungs Kovariable Wechselwirkungen im Rahmen von Experimenten / randomisierten kontrollierten Studien, mit einer binären Behandlung Zuordnungskennzeichen .T.TT Abhängig von der spezifischen Methode / Quelle habe ich sowohl als auch T = { 1 , - 1 } für die behandelten bzw. die unbehandelten Probanden gesehen.T.= { 1 …

3
Umgang mit nicht-binären kategorialen Variablen in der logistischen Regression (SPSS)
Ich muss eine binäre logistische Regression mit vielen unabhängigen Variablen durchführen. Die meisten von ihnen sind binär, aber einige der kategorialen Variablen haben mehr als zwei Ebenen. Was ist der beste Weg, um mit solchen Variablen umzugehen? Für eine Variable mit drei möglichen Werten müssen beispielsweise zwei Dummy-Variablen erstellt werden. …

4
So beweisen Sie statistisch, ob eine Spalte kategoriale Daten enthält oder Python nicht verwendet
Ich habe einen Datenrahmen in Python, in dem ich alle kategorialen Variablen finden muss. Das Überprüfen des Spaltentyps funktioniert nicht immer, da der intTyp auch kategorisch sein kann. Daher suche ich Hilfe bei der Suche nach der richtigen Hypothesentestmethode, um festzustellen, ob eine Spalte kategorisch ist oder nicht. Ich habe …

1
R lineare Regression kategoriale Variable "versteckter" Wert
Dies ist nur ein Beispiel, auf das ich mehrmals gestoßen bin, daher habe ich keine Beispieldaten. Ausführen eines linearen Regressionsmodells in R: a.lm = lm(Y ~ x1 + x2) x1ist eine stetige Variable. x2ist kategorisch und hat drei Werte, z. B. "Niedrig", "Mittel" und "Hoch". Die von R gegebene Ausgabe …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 



1
Dummy-Codierung für Kontraste: 0,1 vs. 1, -1
Ich bitte Sie um Ihre Hilfe, um den Unterschied zwischen zwei verschiedenen Kontrasten für dichotome Variablen zu verstehen. Auf dieser Seite: http://www.psychstat.missouristate.edu/multibook/mlt08.htm unter "Dichotome Prädiktorvariablen" gibt es zwei Möglichkeiten, dichotome Prädiktoren zu codieren: Verwenden des Kontrasts 0,1 oder des Kontrasts 1, -1 . Ich verstehe die Unterscheidung hier irgendwie (0,1 …

2
Warum führt die Kodierung der Behandlung zu einer Korrelation zwischen zufälliger Steigung und Schnittpunkt?
Betrachten Sie ein faktorielles Design innerhalb des Subjekts und innerhalb des Gegenstands, bei dem die experimentelle Behandlungsvariable zwei Ebenen (Bedingungen) aufweist. Sei m1das Maximalmodell und m2das No-Random-Correlations-Modell. m1: y ~ condition + (condition|subject) + (condition|item) m2: y ~ condition + (1|subject) + (0 + condition|subject) + (1|item) + (0 + …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.