(Ein ziemlich langer Beitrag, sorry. Er enthält viele Hintergrundinformationen. Sie können also gerne zur Frage unten springen.) Intro: Ich arbeite an einem Projekt, in dem wir versuchen, die Auswirkung einer binären endogenen Variablen auf ein kontinuierliches Ergebnis zu identifizieren . Wir haben uns ein Instrument , , von dem wir …
Ich bin an behandlungs Kovariable Wechselwirkungen im Rahmen von Experimenten / randomisierten kontrollierten Studien, mit einer binären Behandlung Zuordnungskennzeichen .T.TT Abhängig von der spezifischen Methode / Quelle habe ich sowohl als auch T = { 1 , - 1 } für die behandelten bzw. die unbehandelten Probanden gesehen.T.= { 1 …
Was ist der übliche Ansatz zur Modellierung binärer Zeitreihen? Gibt es ein Papier oder ein Lehrbuch, in dem dies behandelt wird? Ich denke an einen binären Prozess mit starker Autokorrelation. So etwas wie das Vorzeichen eines AR (1) -Prozesses, der bei Null beginnt. Say X.0= 0X0=0X_0 = 0 und X.t …
Ich trainiere eine logistische Regression, um vorherzusagen, welche Läufer am ehesten ein anstrengendes Langstreckenrennen beenden werden. Sehr wenige Läufer absolvieren dieses Rennen, daher habe ich ein schweres Klassenungleichgewicht und eine kleine Auswahl an Erfolgen (vielleicht ein paar Dutzend). Ich habe das Gefühl, ich könnte ein gutes "Signal" von den Dutzenden …
Ich recherchiere über Lernspiele und einige meiner aktuellen Projekte beinhalten die Verwendung von Daten aus BoardGameGeek (BGG) und VideoGameGeek (VGG), um die Beziehungen zwischen Designelementen von Spielen zu untersuchen (dh "im Zweiten Weltkrieg spielen", "Würfeln"). ) und Spielerbewertungen dieser Spiele (dh Punktzahlen von 10). Jedes dieser Designelemente entspricht einem Tag …
Für ein Bayes'sches logistisches Regressionsproblem habe ich eine posteriore prädiktive Verteilung erstellt. Ich nehme eine Stichprobe aus der Vorhersageverteilung und erhalte für jede meiner Beobachtungen Tausende von Stichproben von (0,1). Die Visualisierung der Anpassungsgüte ist weniger als interessant, zum Beispiel: Dieses Diagramm zeigt die 10 000 Proben + den beobachteten …
Ich muss eine Faktorenanalyse für einen Datensatz durchführen, der aus dichotomen Variablen besteht (0 = Ja, 1 = Nein), und ich weiß nicht, ob ich auf dem richtigen Weg bin. Mit tetrachoric()Ich erstelle ich eine Korrelationsmatrix, auf der ich laufe fa(data,factors=1). Das Ergebnis ist ziemlich nahe an den Ergebnissen, die …
Dies ist nur ein Beispiel, auf das ich mehrmals gestoßen bin, daher habe ich keine Beispieldaten. Ausführen eines linearen Regressionsmodells in R: a.lm = lm(Y ~ x1 + x2) x1ist eine stetige Variable. x2ist kategorisch und hat drei Werte, z. B. "Niedrig", "Mittel" und "Hoch". Die von R gegebene Ausgabe …
Ich habe einen Datensatz mit dem folgenden Format. Es gibt ein binäres Ergebnis Krebs / kein Krebs. Jeder Arzt im Datensatz hat jeden Patienten gesehen und ein unabhängiges Urteil darüber abgegeben, ob der Patient Krebs hat oder nicht. Die Ärzte geben dann ihr Konfidenzniveau von 5 an, dass ihre Diagnose …
In meinen Daten habe ich eine Klassenvariable, bezeichnet als . Diese Klassenvariablenwerte sind 0 , 1 (binär). Fast alle Beobachtungen von C sind 0 (nahe 100%, genauer gesagt 97%). Ich möchte einen "Leistungstest" für verschiedene Klassifizierungsmodelle (dies könnte Genauigkeit sein). Was ich befürchte, ist, dass wenn ich ein Klassifizierungsmodell habe, …
Ich möchte wissen, ob es eine Möglichkeit gibt, den Jaccard-Koeffizienten mithilfe der Matrixmultiplikation zu berechnen. Ich habe diesen Code verwendet jaccard_sim <- function(x) { # initialize similarity matrix m <- matrix(NA, nrow=ncol(x),ncol=ncol(x),dimnames=list(colnames(x),colnames(x))) jaccard <- as.data.frame(m) for(i in 1:ncol(x)) { for(j in i:ncol(x)) { jaccard[i,j]= length(which(x[,i] & x[,j])) / length(which(x[,i] | …
Ich habe also 16 Studien, in denen ich versuche, eine Person anhand eines biometrischen Merkmals mithilfe von Hamming Distance zu authentifizieren. Mein Schwellenwert ist auf 3,5 eingestellt. Meine Daten sind unten und nur Versuch 1 ist ein wahres Positiv: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 …
für zB. Wenn ich eine klassenvariable Kreditbewertung mit zwei Klassen gut und schlecht habe, wobei # (gut) = 700 und # (schlecht) = 300. Ich möchte meine Daten nicht verkürzen. Welche Technik sollte ich verwenden? Ich habe SVM verwendet, aber es gibt alles so gut wie gut in Vorhersagen.
Ich beschäftige mich mit Datentypen und brauche Hilfe: Wenn Sie sich das Bild oben ansehen (von hier aus aufgenommen ), hat es folgende Datentypen: Quantitativ (diskret, kontinuierlich) Qualitativ (Nominal (N), Ordinal (O), Binär (B)). Aber wenn Sie sich dieses nächste Bild (von hier ) ansehen , sind die Kategorien: Quantitativ …
Mir scheinen wichtige Informationen zu fehlen. Mir ist bekannt, dass der logistische Regressionskoeffizient in log (Quoten) angegeben ist, der so genannten Logit-Skala. Daher wird zur Interpretation exp(coef)genommen und ergibt OR, das Odds Ratio. Wenn ist, lautet die Interpretation wie folgt: Für eine Erhöhung der Kovariate eine Einheit beträgt das logarithmische …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.