Als «count-data» getaggte Fragen

Zähldaten sind nicht negative Ganzzahlen, die ganze Beträge darstellen.

1
Warum wird die Quadratwurzeltransformation für Zählungsdaten empfohlen?
Es wird oft empfohlen, die Quadratwurzel zu ziehen, wenn Sie Daten zählen. (Beispiele auf CV finden @ HarveyMotulsky Antwort hier oder @ whuber Antwort hier .) Auf der anderen Seite, wenn ein allgemeines lineares Modell mit einer Reaktionsvariable passend als Poisson verteilte, ist das Protokoll der kanonische Link . Dies …


1
Fehlermetriken zur Kreuzvalidierung von Poisson-Modellen
Ich überprüfe ein Modell, das versucht, eine Zählung vorherzusagen. Wenn dies ein Problem mit der binären Klassifizierung wäre, würde ich die Out-of-Fold-AUC berechnen, und wenn dies ein Regressionsproblem wäre, würde ich den Out-of-Fold-RMSE oder MAE berechnen. Welche Fehlermetriken kann ich für ein Poisson-Modell verwenden, um die "Genauigkeit" der Vorhersagen außerhalb …


2
Diagnose für verallgemeinerte lineare (gemischte) Modelle (speziell Residuen)
Derzeit habe ich Probleme, das richtige Modell für schwierige Zähldaten (abhängige Variable) zu finden. Ich habe verschiedene Modelle ausprobiert (für meine Art von Daten sind Modelle mit gemischten Effekten erforderlich), z. B. lmerundlme4 (mit einer logarithmischen Transformation), sowie verallgemeinerte lineare Modelle mit gemischten Effekten mit verschiedenen Familien, z. B. Gaußscher …

2
Kontinuierliche Verallgemeinerung der negativen Binomialverteilung
Die negative Binomialverteilung (NB) ist für nicht negative ganze Zahlen definiert und hat die WahrscheinlichkeitsmassenfunktionIst es sinnvoll, eine kontinuierliche Verteilung auf nicht negative Reelle zu betrachten, die durch dieselbe Formel definiert sind (wobei durch )? Der Binomialkoeffizient kann als ein Produkt von umgeschrieben werden , das für jedes reelle gut …



1
Wann werden Poisson-GLMs vs. geometrische GLMs vs. negative Binomial-GLMs für Zählungsdaten verwendet?
Ich versuche für mich selbst ein Layout zu erstellen, wenn es angebracht ist, welchen Regressionstyp (geometrisch, Poisson, negatives Binomial) mit Zähldaten innerhalb des GLM-Frameworks zu verwenden (nur 3 der 8 GLM-Verteilungen werden für Zähldaten verwendet, obwohl die meisten davon verwendet werden Ich habe Zentren über die negativen Binomial- und Poisson-Verteilungen …

1
Erkennen von Ausreißern in Zähldaten
Ich habe das, was ich naiv für ein recht einfaches Problem hielt, das die Erkennung von Ausreißern für viele verschiedene Sätze von Zähldaten beinhaltet. Insbesondere möchte ich feststellen, ob einer oder mehrere Werte in einer Reihe von Zählungsdaten im Verhältnis zu den restlichen Zählungen in der Verteilung höher oder niedriger …


2
Poisson oder Quasi-Poisson in einer Regression mit Zähldaten und Überdispersion?
Ich habe Zähldaten (Nachfrage- / Angebotsanalyse mit Zählung der Anzahl der Kunden, abhängig von - möglicherweise - vielen Faktoren). Ich habe eine lineare Regression mit normalen Fehlern versucht, aber mein QQ-Plot ist nicht wirklich gut. Ich habe versucht, die Antwort logarithmisch umzuwandeln: wieder ein schlechtes QQ-Diagramm. Jetzt versuche ich eine …

1
Bedeutung der Differenz zwischen zwei Zählungen
Gibt es eine Möglichkeit, festzustellen, ob ein Unterschied zwischen der Anzahl der Verkehrsunfälle zum Zeitpunkt 1 erheblich von der Anzahl zum Zeitpunkt 2 abweicht? Ich habe verschiedene Methoden gefunden, um den Unterschied zwischen Beobachtungsgruppen zu verschiedenen Zeiten zu bestimmen (z. B. Vergleich der Poisson-Mittelwerte), aber nicht, um nur zwei Zählungen …

2
Verstößt die Verwendung von Zähldaten als unabhängige Variable gegen eine der GLM-Annahmen?
Ich möchte Zähldaten als Kovariaten verwenden, während ich ein logistisches Regressionsmodell anpasse. Meine Frage ist: Verstoße ich gegen eine Annahme der logistischen (und allgemeiner der verallgemeinerten linearen) Modelle, indem ich count, nicht negative ganzzahlige Variablen als unabhängige Variablen verwende? Ich fand in der Literatur viele Hinweise darauf, wie heiß es …

2
Standardfehler einer Zählung
Ich habe einen Datensatz von Vorfallsfällen nach Jahreszeit einer seltenen Krankheit. Angenommen, es gab 180 Fälle im Frühjahr, 90 im Sommer, 45 im Herbst und 210 im Winter. Ich kämpfe mit der Frage, ob es angebracht ist, Standardfehler an diese Zahlen anzuhängen. Die Forschungsziele sind insofern schlüssig, als wir nach …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.