Als «binary-data» getaggte Fragen

Eine binäre Variable nimmt einen von zwei Werten an, die normalerweise als "0" und "1" codiert sind.

1
Wie interpretiert man den Koeffizienten der zweiten Stufe in der Regression instrumenteller Variablen mit einem binären Instrument und einer binären endogenen Variablen?
(Ein ziemlich langer Beitrag, sorry. Er enthält viele Hintergrundinformationen. Sie können also gerne zur Frage unten springen.) Intro: Ich arbeite an einem Projekt, in dem wir versuchen, die Auswirkung einer binären endogenen Variablen auf ein kontinuierliches Ergebnis zu identifizieren . Wir haben uns ein Instrument , , von dem wir …

3
Indikatorvariable für Binärdaten: {-1,1} vs {0,1}
Ich bin an behandlungs Kovariable Wechselwirkungen im Rahmen von Experimenten / randomisierten kontrollierten Studien, mit einer binären Behandlung Zuordnungskennzeichen .T.TT Abhängig von der spezifischen Methode / Quelle habe ich sowohl als auch T = { 1 , - 1 } für die behandelten bzw. die unbehandelten Probanden gesehen.T.= { 1 …


1
Ist es jemals eine gute Idee, beim Training einer logistischen Regression „Teilkredit“ (kontinuierliches Ergebnis) zu geben?
Ich trainiere eine logistische Regression, um vorherzusagen, welche Läufer am ehesten ein anstrengendes Langstreckenrennen beenden werden. Sehr wenige Läufer absolvieren dieses Rennen, daher habe ich ein schweres Klassenungleichgewicht und eine kleine Auswahl an Erfolgen (vielleicht ein paar Dutzend). Ich habe das Gefühl, ich könnte ein gutes "Signal" von den Dutzenden …

1
Was sind die Gefahren bei der Berechnung von Pearson-Korrelationen (anstelle von tetrachorischen) für binäre Variablen in der Faktoranalyse?
Ich recherchiere über Lernspiele und einige meiner aktuellen Projekte beinhalten die Verwendung von Daten aus BoardGameGeek (BGG) und VideoGameGeek (VGG), um die Beziehungen zwischen Designelementen von Spielen zu untersuchen (dh "im Zweiten Weltkrieg spielen", "Würfeln"). ) und Spielerbewertungen dieser Spiele (dh Punktzahlen von 10). Jedes dieser Designelemente entspricht einem Tag …

3
Visualisierung der Bayes'schen Anpassungsgüte für die logistische Regression
Für ein Bayes'sches logistisches Regressionsproblem habe ich eine posteriore prädiktive Verteilung erstellt. Ich nehme eine Stichprobe aus der Vorhersageverteilung und erhalte für jede meiner Beobachtungen Tausende von Stichproben von (0,1). Die Visualisierung der Anpassungsgüte ist weniger als interessant, zum Beispiel: Dieses Diagramm zeigt die 10 000 Proben + den beobachteten …


1
R lineare Regression kategoriale Variable "versteckter" Wert
Dies ist nur ein Beispiel, auf das ich mehrmals gestoßen bin, daher habe ich keine Beispieldaten. Ausführen eines linearen Regressionsmodells in R: a.lm = lm(Y ~ x1 + x2) x1ist eine stetige Variable. x2ist kategorisch und hat drei Werte, z. B. "Niedrig", "Mittel" und "Hoch". Die von R gegebene Ausgabe …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 


5
Wie kann man die Leistung eines Klassifikators messen, wenn fast 100% der Klassenbezeichnungen zu einer Klasse gehören?
In meinen Daten habe ich eine Klassenvariable, bezeichnet als . Diese Klassenvariablenwerte sind 0 , 1 (binär). Fast alle Beobachtungen von C sind 0 (nahe 100%, genauer gesagt 97%). Ich möchte einen "Leistungstest" für verschiedene Klassifizierungsmodelle (dies könnte Genauigkeit sein). Was ich befürchte, ist, dass wenn ich ein Klassifizierungsmodell habe, …

3
Berechnung von Jaccard oder einem anderen Assoziationskoeffizienten für Binärdaten unter Verwendung der Matrixmultiplikation
Ich möchte wissen, ob es eine Möglichkeit gibt, den Jaccard-Koeffizienten mithilfe der Matrixmultiplikation zu berechnen. Ich habe diesen Code verwendet jaccard_sim <- function(x) { # initialize similarity matrix m <- matrix(NA, nrow=ncol(x),ncol=ncol(x),dimnames=list(colnames(x),colnames(x))) jaccard <- as.data.frame(m) for(i in 1:ncol(x)) { for(j in i:ncol(x)) { jaccard[i,j]= length(which(x[,i] & x[,j])) / length(which(x[,i] | …

2
Berechnen Sie die ROC-Kurve für Daten
Ich habe also 16 Studien, in denen ich versuche, eine Person anhand eines biometrischen Merkmals mithilfe von Hamming Distance zu authentifizieren. Mein Schwellenwert ist auf 3,5 eingestellt. Meine Daten sind unten und nur Versuch 1 ist ein wahres Positiv: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 



3
logit - Koeffizienten als Wahrscheinlichkeiten interpretieren
Mir scheinen wichtige Informationen zu fehlen. Mir ist bekannt, dass der logistische Regressionskoeffizient in log (Quoten) angegeben ist, der so genannten Logit-Skala. Daher wird zur Interpretation exp(coef)genommen und ergibt OR, das Odds Ratio. Wenn ist, lautet die Interpretation wie folgt: Für eine Erhöhung der Kovariate eine Einheit beträgt das logarithmische …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.