Als «association-measure» getaggte Fragen

Messungen der Assoziation zwischen Variablen, ein allgemeineres Konzept als die Korrelation

3
Ein Beispiel: LASSO-Regression unter Verwendung von glmnet für binäre Ergebnisse
Ich beginne mit der Verwendung von dabble glmnetmit LASSO Regression , wo mein Ergebnis von Interesse dichotomous ist. Ich habe unten einen kleinen nachgebildeten Datenrahmen erstellt: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


1
Wie kann man sich eine riesige, spärliche Kontingenztabelle vorstellen?
Ich habe zwei Variablen: Drogenname (DN) und entsprechende unerwünschte Ereignisse (AE), die in einer Beziehung von vielen zu vielen stehen. Es gibt 33.556 Medikamentennamen und 9.516 unerwünschte Ereignisse. Die Stichprobengröße beträgt etwa 5,8 Millionen Beobachtungen. Ich möchte die Assoziation / Beziehung zwischen DN und AE studieren und verstehen. Ich denke …



1
Was ist das richtige Assoziationsmaß einer Variablen mit einer PCA-Komponente (auf einem Biplot / Ladeplot)?
Ich benutze FactoMineR, um meinen Messdatensatz auf die latenten Variablen zu reduzieren. Die variable Karte oben ist für mich klar zu interpretieren, aber ich bin verwirrt , wenn es um den Zusammenhang zwischen den Variablen und Komponente 1. Mit Blick auf der variablen Karte kommt, ddpund covist sehr nah an …

2
Anwendbarkeit des Chi-Quadrat-Tests, wenn viele Zellen Frequenzen unter 5 aufweisen
Um einen Zusammenhang zwischen der Unterstützung durch Gleichaltrige (unabhängige Variable) und der Arbeitszufriedenheit (abhängige Variable) zu finden, möchte ich einen Chi-Quadrat-Test anwenden. Die Unterstützung durch Gleichaltrige wird in vier Gruppen eingeteilt, je nach Umfang der Unterstützung: 1 = sehr geringer Umfang, 2 = in gewissem Umfang, 3 = in großem …


1
Was ist die optimale Distanzfunktion für Personen, wenn Attribute nominal sind?
Ich weiß nicht, welche Distanzfunktion zwischen Individuen bei nominalen (ungeordneten kategorialen) Attributen verwendet werden soll. Ich habe ein Lehrbuch gelesen und sie schlagen die Simple Matching- Funktion vor, aber einige Bücher schlagen vor, dass ich die nominalen in binäre Attribute ändern und den Jaccard- Koeffizienten verwenden sollte. Was ist jedoch, …

3
Mit welchen statistischen Methoden kann ich beliebte oder häufig verwendete Kombinationen kategorialer Variablen finden?
Ich mache eine Studie über den Gebrauch von Polydrogen. Ich habe einen Datensatz von 400 Drogenabhängigen, die jeweils die Drogen angegeben haben, die sie missbrauchen. Es gibt mehr als 10 Medikamente und daher große mögliche Kombinationen. Ich habe die meisten Drogen, die sie konsumieren, in binäre Variablen umkodiert (dh Heroin …

2
Korrelation zwischen dichotomer und kontinuierlicher Variable
Ich versuche die Korrelation zwischen einer dichotomen und einer kontinuierlichen Variablen zu finden. Bei meinen Grundlagenarbeiten habe ich festgestellt, dass ich einen unabhängigen t-Test verwenden muss und die Voraussetzung dafür ist, dass die Verteilung der Variablen normal sein muss. Ich führte einen Kolmogorov-Smirnov-Test zum Testen der Normalität durch und stellte …


3
Berechnung von Jaccard oder einem anderen Assoziationskoeffizienten für Binärdaten unter Verwendung der Matrixmultiplikation
Ich möchte wissen, ob es eine Möglichkeit gibt, den Jaccard-Koeffizienten mithilfe der Matrixmultiplikation zu berechnen. Ich habe diesen Code verwendet jaccard_sim <- function(x) { # initialize similarity matrix m <- matrix(NA, nrow=ncol(x),ncol=ncol(x),dimnames=list(colnames(x),colnames(x))) jaccard <- as.data.frame(m) for(i in 1:ncol(x)) { for(j in i:ncol(x)) { jaccard[i,j]= length(which(x[,i] & x[,j])) / length(which(x[,i] | …

2
Parametrisches, semiparametrisches und nichtparametrisches Bootstrapping für gemischte Modelle
Die folgenden Transplantate stammen aus diesem Artikel . Ich bin ein Neuling im Bootstrap und versuche, das parametrische, semiparametrische und nichtparametrische Bootstrapping-Bootstrapping für ein lineares gemischtes Modell mit R bootPaket zu implementieren. R-Code Hier ist mein RCode: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

2
Wie heißt dieses Korrelations- / Assoziationsmaß zwischen binären Variablen?
Es gibt mehrere Maßnahmen der Assoziation (oder Kontingenz oder Korrelation) zwischen zwei binären Zufallsvariablen und , unter anderemXXXYYY Pearson- Phi-Koeffizient Cramérs V. Ich frage mich, wie sich die folgende Zahl auf bekannte Maßnahmen bezieht, ob sie statistisch interessant ist und unter welchem ​​Namen sie (möglicherweise) diskutiert wird:κκ\kappa κ=1−2N|X△Y|κ=1−2N|X△Y|\kappa = 1 …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.