Verwenden Sie dieses Tag für jede * themenbezogene * Frage, bei der (a) "R" entweder als kritischer Teil der Frage oder als erwartete Antwort enthält, und (b) nicht * nur * die Verwendung von "R" betrifft.
Sehr geehrte Damen und Herren, mir ist etwas Merkwürdiges aufgefallen, das ich Ihnen nicht erklären kann. Zusammenfassend lässt sich sagen, dass der manuelle Ansatz zur Berechnung eines Konfidenzintervalls in einem logistischen Regressionsmodell und die R-Funktion confint()unterschiedliche Ergebnisse liefern. Ich habe die angewandte logistische Regression von Hosmer & Lemeshow (2. Auflage) …
Ich arbeite gerade an einem Statistiklehrbuch, während ich R lerne, und bin auf ein Stolperstein im folgenden Beispiel gestoßen: Nach dem Betrachten habe ?quantileich versucht, dies in R mit den folgenden neu zu erstellen: > nuclear <- c(7, 20, 16, 6, 58, 9, 20, 50, 23, 33, 8, 10, 15, …
Ich bin neu in der Modellierung mit neuronalen Netzwerken, aber es ist mir gelungen, ein neuronales Netzwerk mit allen verfügbaren Datenpunkten einzurichten, das gut zu den beobachteten Daten passt. Das neuronale Netzwerk wurde in R mit dem nnet-Paket erstellt: require(nnet) ##33.8 is the highest value mynnet.fit <- nnet(DOC/33.80 ~ ., …
Ich versuche zu verstehen, Standardfehler "Clustering" und wie in R auszuführen (es ist in Stata trivial). In RI ist es mir nicht gelungen, entweder plmmeine eigene Funktion zu verwenden oder zu schreiben. Ich werde die diamondsDaten aus dem ggplot2Paket verwenden. Ich kann feste Effekte mit beiden Dummy-Variablen machen > library(plyr) …
Ich suche ein gutes Buch / Tutorial, um mehr über die Überlebensanalyse zu erfahren. Ich bin auch an Referenzen zur Durchführung von Überlebensanalysen in R interessiert.
Ich benutze normalerweise BIC, da ich verstehe, dass es Parsimonie stärker schätzt als AIC. Ich habe mich jetzt jedoch für einen umfassenderen Ansatz entschieden und möchte auch AIC verwenden. Ich weiß, dass Raftery (1995) gute Richtlinien für BIC-Unterschiede vorgelegt hat: 0-2 ist schwach, 2-4 ist ein positiver Beweis dafür, dass …
Aus der Dokumentation für anova(): Wenn 'anova' eine Sequenz von Objekten erhält, werden die Modelle in der angegebenen Reihenfolge gegeneinander getestet ... Was bedeutet es, die Modelle gegeneinander zu testen? Und warum ist die Bestellung wichtig? Hier ist ein Beispiel aus dem GenABEL-Tutorial : > modelAdd = lm(qt~as.numeric(snp1)) > modelDom …
Es gibt eine Reihe robuster Skalenschätzer . Ein bemerkenswertes Beispiel ist die mittlere absolute Abweichung, die sich auf die Standardabweichung als . In einem Bayes'schen Framework gibt es eine Reihe von Möglichkeiten, den Ort einer ungefähren Normalverteilung (z. B. einer durch Ausreißer kontaminierten Normalverteilung) zuverlässig abzuschätzen. Man könnte beispielsweise annehmen, …
Ich passe ein lm()Modell an einen Datensatz an, der Indikatoren für das Geschäftsquartal enthält (Q1, Q2, Q3, wodurch Q4 zum Standard wird). Verwenden von lm(Y~., data = data) Ich erhalte einen NAals Koeffizienten für Q3 und eine Warnung, dass eine Variable aufgrund von Singularitäten ausgeschlossen wurde. Muss ich eine Q4-Spalte …
Sie können Daten im Breit- oder Langformat haben. Dies ist sehr wichtig, da die verwendbaren Methoden je nach Format unterschiedlich sind. Ich weiß, dass Sie mit melt()und cast()aus dem Umgestaltungspaket arbeiten müssen, aber es scheint einige Dinge zu geben, die ich nicht verstehe. Kann mir jemand einen kurzen Überblick geben, …
Ich möchte einen Vektor B für jede der Spalten in einer Matrix A regressieren. Dies ist trivial, wenn keine Daten fehlen. Wenn die Matrix A jedoch fehlende Werte enthält, darf meine Regression für A nur Zeilen enthalten, in denen alle enthalten sind Werte sind vorhanden (das Standardverhalten von na.omit ). …
Ich möchte ein mehrstufiges GLMM mit einer Poisson-Verteilung (mit Überdispersion) unter Verwendung von R ausrüsten. Im Moment verwende ich lme4, aber mir ist aufgefallen, dass die quasipoissonFamilie kürzlich entfernt wurde. Ich habe an anderer Stelle gesehen, dass Sie additive Überdispersion für Binomialverteilungen modellieren können, indem Sie einen zufälligen Achsenabschnitt mit …
Nehmen wir an, wir haben die unten angegebenen Statistiken gender mean sd n f 1.666667 0.5773503 3 m 4.500000 0.5773503 4 Wie führt man einen T-Test mit zwei Stichproben durch (um festzustellen, ob bei einer Variablen ein signifikanter Unterschied zwischen Männern und Frauen besteht), wobei man Statistiken wie diese anstelle …
Es wurde viel über farbenblinde Farbauswahlmöglichkeiten für Karten, Polygone und schattierte Bereiche im Allgemeinen geschrieben (siehe zum Beispiel http://colorbrewer2.org ). Ich konnte keine Empfehlungen für Linienfarben und unterschiedliche Liniendicken für Liniendiagramme finden. Ziele sind: leicht zu unterscheiden Linien, auch wenn sie sich verflechten Linien sind von Personen mit den häufigsten …
Was sind einige nützliche Richtlinien zum Testen von Parametern (z. B. Interaktionstiefe, Kind, Abtastrate usw.) mit GBM? Nehmen wir an, ich habe 70-100 Features, eine Bevölkerung von 200.000 und ich beabsichtige, die Interaktionstiefe von 3 und 4 zu testen. Natürlich muss ich einige Tests durchführen, um zu sehen, welche Parameterkombination …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.