Update 15.01.2014
Mir ist klar, dass ich Danicas ursprüngliche Frage, ob die Fehlerquote für den indirekt angepassten Anteil deaktiviert größer oder kleiner als die Fehlerquote für dieselbe Rate in ACS ist, nicht beantwortet habe. Die Antwort lautet: Wenn sich die Anteile der Unternehmenskategorie nicht drastisch von den staatlichen ACS-Anteilen unterscheiden, ist die unten angegebene Fehlerquote kleiner als die ACS-Fehlerquote. Der Grund: Die indirekte Rate behandelt die Anzahl der Personen in der Organisationskategorie der Organisation (oder die relativen Anteile) als feste Zahlen. Die ACS-Schätzung des Anteils deaktiviert erfordert tatsächlich eine Schätzung dieser Anteile, und die Fehlergrenzen werden erhöht, um dies widerzuspiegeln.
Schreiben Sie zur Veranschaulichung die deaktivierte Rate wie folgt:
P^adj=∑ninpi^
Dabei ist die geschätzte Behinderungsrate in Kategorie im ACS.p^ii
Andererseits beträgt die geschätzte ACS-Rate tatsächlich:
P^acs=∑(NiN)ˆpi^
wobei und jeweils die Bevölkerungskategorie und die Gesamtsumme sind und der Bevölkerungsanteil in Kategorie .NiNNi/Ni
Somit ist der Standardfehler für die ACS-Rate größer, da zusätzlich zu geschätzt werden .Ni/Npi
Wenn sich die Anteile der Organisationskategorien und die geschätzten Anteile der Bevölkerung stark unterscheiden, ist es möglich, dass . In einem von mir konstruierten Beispiel mit zwei Kategorien wurden die Kategorien in den Anteilen und . Der Standardfehler für den geschätzten deaktivierten Anteil war .SE(P^adj)>SE(P^acs)N1/N=0.7345N2/N=0.2655SE(P^acs)=0.0677
Wenn ich 0,7345 und 0,2655 als feste Werte und (der indirekte Anpassungsansatz) betrachte, ist , viel kleiner. Wenn stattdessen und , , ungefähr das gleiche wie Am äußersten und , . Es würde mich wundern, wenn sich die Anteile von Organisation und Bevölkerungskategorie so drastisch unterscheiden. Wenn dies nicht der Fall ist, ist es meiner Meinung nach sicher, die ACS-Fehlerquote als konservative, möglicherweise sehr konservative Schätzung der tatsächlichen Fehlerquote zu verwenden.n1/nn2/nSE(P^adj)=0.0375n1/n=0.15n2/n=0.85SE(P^adj)=0.0678SE(P^acs)n1/n=0.001S E ( P a d j ) = 0,079n2/n=0.999SE(P^adj)=0.079
Update 2014-01-14
Kurze Antwort
Meiner Meinung nach wäre es unverantwortlich, eine solche Statistik ohne CI oder Fehlerquote (halbe CI-Länge) vorzulegen. Um diese zu berechnen, müssen Sie das ACS Public Use Microdata Sample (PUMS) herunterladen und analysieren ( http://www.census.gov/acs/www/data_documentation/public_use_microdata_sample/ ).
Lange Antwort
Dies ist nicht wirklich eine Neugewichtung des ACS. Es ist eine Version der indirekten Standardisierung, ein Standardverfahren in der Epidemiologie (google oder siehe irgendeinen Epi-Text). In diesem Fall werden die Invaliditätsraten für ACS-Jobs (Kategorien) nach der Anzahl der Mitarbeiter in der Jobkategorie der Organisation gewichtet. Dadurch wird eine erwartete Anzahl behinderter Menschen in der Organisation berechnet E
, die mit der beobachteten Anzahl verglichen werden kann O
. Die übliche Metrik für den Vergleich ist ein standardisiertes Verhältnis R= (O/E)
. (Der übliche Begriff ist "SMR" für "standardisierte Sterblichkeitsrate", aber hier ist das "Ergebnis" Behinderung.) R
ist auch das Verhältnis der beobachteten Invaliditätsrate (O/n)
und der indirekt standardisierten Rate (E/n)
, wobei n
die Anzahl der Mitarbeiter der Organisation ist.
In diesem Fall scheint es, dass nur ein CI für E
oder E/n
benötigt wird, also beginne ich damit:
Wenn
n_i = the organization employee count in job category i
p_i = disability rate for job category i in the ACS
Dann
E = sum (n_i p_i)
Die Varianz von E
ist:
var(E) = nn' V nn
Dabei nn
ist der Spaltenvektor der Anzahl der Organisationskategorien und V
die geschätzte Varianz-Kovarianz-Matrix der Invaliditätsraten der ACS-Kategorie.
Auch trivial se(E) = sqrt(var(E))
und se(E/n) = se(E)/n
.
und ein 90% CI für E ist
E ± 1.645 SE(E)
Teilen Sie durch n
, um das CI für zu erhalten E/n
.
Zum Schätzen var(E)
müssten Sie die PUMS-Daten (Public Use Microdata Sample) von ACS herunterladen und analysieren ( http://www.census.gov/acs/www/data_documentation/public_use_microdata_sample/ ).
Ich kann nur über den Prozess für das Rechnen var(E)
in Stata sprechen . Da ich nicht weiß, ob Ihnen das zur Verfügung steht, werde ich die Details verschieben. Jemand, der mit den Vermessungsfunktionen von R oder (möglicherweise) SAS vertraut ist, kann jedoch auch Code aus den obigen Gleichungen bereitstellen.
Konfidenzintervall für das Verhältnis R
Konfidenzintervalle für R
basieren normalerweise auf einer Poisson-Annahme für O
, aber diese Annahme kann falsch sein.
Wir können also überlegen O
und E
unabhängig sein
log R = log(O) - log(E) ->
var(log R) = var(log O) + var(log(E))
var(log(E))
kann als ein weiterer Stata-Schritt nach der Berechnung von berechnet werden var(E)
.
Unter der Annahme der Poisson-Unabhängigkeit:
var(log O) ~ 1/E(O).
Ein Programm wie Stata könnte beispielsweise in ein negatives Binomialmodell oder ein verallgemeinertes lineares Modell passen und Ihnen einen genaueren Varianzterm geben.
Ein ungefährer 90% CI für log R
ist
log R ± 1.645 sqrt(var(log R))
und die Endpunkte können potenziert werden, um das CI für zu erhalten R
.