Angenommen, ich habe drei Datensätze der Größe :nnn y1y1y_1 = Größe von Menschen nur aus den USA y2y2y_2 = Körpergröße von Männern aus der ganzen Welt y3y3y_3 = von Frauen aus der ganzen Welt Und ich baue für jedes ein lineares Modell mit den Faktoren , :xixix_ii=1,...,ki=1,...,ki = 1,..., k …
Angenommen, ich habe ein kontinuierliches Ergebnis yund zwei faktorielle Prädiktoren mit jeweils zwei Ebenen. Einer meiner kategorialen Prädiktoren drugkann zwei Ebenen haben ("A" oder "B"), der andere ist smokeYes. Wenn ich ein Regressionsmodell ausführe, kann ich die Basislinie oder den Referenzpegel drugentweder als "A" auswählen , wie in model1: set.seed(123) …
Ich habe Daten, die beschreiben, wie oft ein Ereignis während einer Stunde stattfindet ("Anzahl pro Stunde", nph) und wie lange die Ereignisse dauern ("Dauer in Sekunden pro Stunde", dph). Dies sind die Originaldaten: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, …
Ich untersuche Trends (zwischen 1998 und 2011) der Sterblichkeitsraten bei Patienten mit Morbus Crohn. Jeder Patient (Fall) wurde in den Jahren 1998 bis 2011 eingeschlossen. Bei der Aufnahme wurde jeder Patient einer gesunden Kontrolle mit demselben Alter und Geschlecht zugeordnet. Ich analysiere Trends bei den Sterblichkeitsraten. Wenn ich dies direkt …
Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly spendist die Antwortvariable. Der Trainingsdatensatz enthält jedoch ungefähr 3 Millionen Zeilen, …
Ich habe einen Datensatz, der einige hundert Transaktionen von drei Lieferanten enthält, die über einen Zeitraum von drei Jahren in über 100 Ländern tätig sind. Wir haben festgestellt, dass das Verkaufsland kein wesentlicher Faktor für die erzielten Preise ist (die Produkte sind mehr oder weniger globale Waren). Alle Preise sind …
Ich habe eine Reihe von Beobachtungen, unabhängig von der Zeit. Ich frage mich, ob ich Autokorrelationstests durchführen soll. Es scheint mir, dass es keinen Sinn macht, da meine Daten keine Zeitkomponente enthalten. Ich habe jedoch tatsächlich einen seriellen Korrelations-LM-Test versucht, der auf eine starke Autokorrelation der Residuen hinweist. Macht es …
Ich bitte Sie um Ihre Hilfe, um den Unterschied zwischen zwei verschiedenen Kontrasten für dichotome Variablen zu verstehen. Auf dieser Seite: http://www.psychstat.missouristate.edu/multibook/mlt08.htm unter "Dichotome Prädiktorvariablen" gibt es zwei Möglichkeiten, dichotome Prädiktoren zu codieren: Verwenden des Kontrasts 0,1 oder des Kontrasts 1, -1 . Ich verstehe die Unterscheidung hier irgendwie (0,1 …
Ich habe zwei Gruppen von 10 Teilnehmern, die während eines Experiments dreimal bewertet wurden. Um die Unterschiede zwischen den Gruppen und zwischen den drei Bewertungen zu testen, führte ich eine 2 × 3-ANOVA mit gemischtem Design mit group(Kontrolle, experimentell), time(erste, zweite, drei) und group x time. Beides timeund groupErgebnis signifikant, …
Ich habe ein Problem mit multipler Regression, das ich mit einer einfachen multiplen Regression zu lösen versucht habe: model1 <- lm(Y ~ X1 + X2 + X3 + X4 + X5, data=data) Dies scheint die 85% der Varianz (gemäß R-Quadrat) zu erklären, die ziemlich gut zu sein scheint. Was mich …
Ich berechne einige bedingte Wahrscheinlichkeiten und zugehörige 95% -Konfidenzintervalle. In vielen meiner Fälle habe ich eine einfache Anzahl von xErfolgen aus nVersuchen (aus einer Kontingenztabelle), sodass ich ein Binomial-Konfidenzintervall verwenden kann, wie es binom.confint(x, n, method='exact')in in angegeben ist R. In anderen Fällen habe ich solche Daten jedoch nicht, daher …
Ich werde meine Beispiele mit R-Aufrufen geben. Zunächst ein einfaches Beispiel einer linearen Regression mit einer abhängigen Variablen 'Lebensdauer' und zwei kontinuierlichen erklärenden Variablen. data.frame(height=runif(4000,160,200))->human.life human.life$weight=runif(4000,50,120) human.life$lifespan=sample(45:90,4000,replace=TRUE) summary(lm(lifespan~1+height+weight,data=human.life)) Call: lm(formula = lifespan ~ 1 + height + weight, data = human.life) Residuals: Min 1Q Median 3Q Max -23.0257 -11.9124 -0.0565 …
Zunächst stelle ich fest, dass multiple Regression nicht wirklich "kausale" Rückschlüsse auf die Daten liefert. Lassen Sie mich meinen aktuellen Fall erklären: Ich habe vier unabhängige Variablen, von denen ich hoffe (aber nicht sicher bin), dass sie das messen, was ich messe. Ich wollte die multiple Regression verwenden, um zu …
Ich habe Daten, bei denen das Ergebnis der Anteil einer Art ist, der in einem Gebiet von einer Maschine an zwei verschiedenen Tagen beobachtet wurde. Da das Ergebnis ein Anteil ist und nicht 0 oder 1 enthält, habe ich eine Beta-Regression verwendet, um das Modell anzupassen. Die Temperatur wird als …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.