Paneldaten beziehen sich auf mehrdimensionale Daten, die häufig Messungen über die Zeit in der Ökonometrie beinhalten. In der Biostatistik werden sie auch als Längsschnittdaten bezeichnet.
Für meine Masterarbeit möchte ich grundsätzlich herausfinden, warum Entwicklungsländer stagnieren. Neben theoretischen Aspekten möchte ich auch eine Regression vornehmen. Ich möchte das BIP oder das BIP-Wachstum als abhängige Variable von vielen unabhängigen Variablen wie der Amtszeit des Staatsoberhauptes, der Lebenserwartung, der Einschränkung der Arbeitszeit, der Alphabetisierung von Erwachsenen und dem …
Ich habe Daten, die beschreiben, wie oft ein Ereignis während einer Stunde stattfindet ("Anzahl pro Stunde", nph) und wie lange die Ereignisse dauern ("Dauer in Sekunden pro Stunde", dph). Dies sind die Originaldaten: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, …
Ich versuche, das geschlechtsspezifische Lohngefälle für männliche und weibliche Büroangestellte in einem großen schwedischen Unternehmen abzuschätzen, um zu testen, ob es eine Diskriminierung aufgrund des Geschlechts gibt. Der Hausman-Test lehnt die Null ab, dass die einzelnen festen Effekte zufällig sind, und daher kann ich mich nicht auf gepoolte OLS oder …
Das grundlegende Verfahren zur Anpassung der Neigungsbewertung arbeitet mit Querschnittsdaten (dh zu einem bestimmten Zeitpunkt gesammelt). Der beliebte Befehl psmatch2 verwendet eine Dummy-Variable, die angibt, dass eine Beobachtung entweder zur Behandlungs- oder zur Kontrollgruppe gehört. In meinem Datensatz variiert diese Indikatorfunktion jedoch zeitlich. Die Daten sehen wie folgt aus: Ich …
Ich habe zwei Fragen zu festen Effekten im DD-Modell. Ich habe eine Behandlung, die zu unterschiedlichen Zeiten stattfindet (z. B. 2001, 2005 usw.). Ich möchte ein DD-Modell anpassen, daher standardisiere ich die Behandlungsjahre bis zum Jahr "0" als Behandlungszeit. Um die Heterogenität des Behandlungsjahres zu kontrollieren, habe ich die Fixeffekte …
Ich versuche, die beste Spezifikation für meinen Datensatz herauszufinden. Ich versuche, die Wirksamkeit der Sonderwirtschaftszonen in Polen im Sinne des Wirtschaftswachstums in drei ähnlichen Paneldatenmodellen für erläuterte Variablen zu untersuchen: a) registrierte Arbeitslosenquote b) BIP pro Kopf c) Bruttoanlageinvestitionen pro Kopf . Die Daten beziehen sich auf NUTS3-Unterregionen. Die erklärenden …
Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly spendist die Antwortvariable. Der Trainingsdatensatz enthält jedoch ungefähr 3 Millionen Zeilen, …
Für Längsschnittdaten mit einem numerischen Ergebnis kann ich Spaghetti-Diagramme verwenden, um die Daten zu visualisieren. Zum Beispiel so etwas (entnommen aus der UCLA Stats-Site): tolerance<-read.table("http://www.ats.ucla.edu/stat/r/faq/tolpp.csv",sep=",", header=T) head(tolerance, n=10) interaction.plot(tolerance$time, tolerance$id, tolerance$tolerance, xlab="time", ylab="Tolerance", legend=F) Aber was ist, wenn mein Ergebnis binär 0 oder 1 ist? Zum Beispiel zeigt in den …
Ich habe das plmPaket und möchte Unit-Root-Tests für einige Variablen ausführen. Ich erhalte folgende Fehlermeldung: > purtest(data$tot.emp) Error in data.frame(baldwin = c(59870, 61259, 60397, 58919, 57856, 57227, : arguments imply differing number of rows: 14, 19, 11, 12, 1, 20, 18, 10, 13 Ich gehe davon aus, dass ich diesen …
Ich habe eine Frage zur Korrektur von Standardfehlern, wenn die unabhängige Variable korreliert. In einer einfachen Zeitreiheneinstellung können wir die Newey-West-Kovarianzmatrix mit einer Reihe von Verzögerungen verwenden, um das Problem der Korrelation in den Residuen zu lösen. Was macht man in einer Panel-Dateneinstellung? Stellen Sie sich die Situation vor, in …
Ich habe versucht, R für einige Längsmodelle zu verwenden, hauptsächlich über lmerund nlmePakete. Es scheint jedoch, dass viele Standardmodelle fehlen, wie beispielsweise Antedependenzmodelle oder faktoranalytische Modelle für Kovarianzmatrizen. Diese Modelle sind in SAS leicht verfügbar. Würde jemand andere Pakete für den Job in R empfehlen? Es ist mir eigentlich egal, …
Ich habe 100 Patienten und jeder Patient hat 10 longitudinale Serumkreatininmessungen. Die geschätzten glomerulären Filtrationsraten (eGFR) wurden aus einer MDRD-Formel berechnet, die Geschlecht, Alter und Serumkreatinin umfasste. eGFR ist die abhängige Variable und die Zeit ist die unabhängige Variable in der linearen Regression für jeden Patienten. Verstoßen lineare Regressionen gegen …
Ich habe viele Messungen für mehrere Personen, bin mir aber nicht sicher, wie ich diese Wiederholungsmessstruktur beim Ausführen eines zufälligen Waldmodells berücksichtigen soll. Gibt es eine Möglichkeit, die zugrunde liegende Datenstruktur von Längsschnittdaten mithilfe eines zufälligen Waldmodells zu berücksichtigen? Ist das überhaupt nötig? - es scheint mir, dass es sein …
Ich begann über Panel-Regressionsmodelle zu lesen. Ich bin jedoch etwas verwirrt über die unterschiedlichen Modellspezifikationen im Modell mit festen Effekten: Bedeutet eine Regression des Panels mit festen Effekten immer, dass ich Dummy-Variablen für die Querschnitte einführe (z. B. für jedes Land in meiner Stichprobe) und dann z. B. eine OLS-Schätzung …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.