Vergrößerung einer Zufallsstichprobe


7

In unserem Projekt haben wir eine Bevölkerung von mehr als 1000 Personen. Wir haben eine Zufallsstichprobe von 107 Personen ausgewählt, aber dann haben wir festgestellt, dass wir mehr Präzision benötigen. Deshalb möchten wir jetzt eine größere Stichprobe haben.

Das Problem ist, dass die Stichprobe in unserem Fall teuer ist. Daher haben wir darüber nachgedacht, eine weitere Zufallsstichprobe von etwa 50 Personen aus den verbleibenden 900+ Personen auszuwählen und zur ersten Stichprobe hinzuzufügen, um eine größere Stichprobe zu erhalten, ohne von vorne zu beginnen.

Würde diese neue Stichprobe immer noch als zufällig angesehen werden?

Bearbeiten: Wir nehmen diese Stichprobe, um die Verteilung der gesamten Bevölkerung abzuschätzen. Mit der aktuellen Stichprobe erhalten wir jedoch zu viele "Löcher" in unserer Verteilung, was zu scheinbar ungenauen Ergebnissen führt.


3
Sie sollten genauer wissen, warum Sie erkannt haben, dass Sie mehr Präzision benötigen. Haben Sie sich Ihre Daten angesehen oder Statistiken berechnet, um dies zu realisieren? Sie sollten auch erwähnen, ob Sie eine Hypothese testen oder nur eine Statistik schätzen möchten.
Brumar

2
Ich denke, Brumars Kommentar ist kritisch; Wenn die Überlegungen zur erneuten Probenahme nicht auf irgendetwas in der Probe selbst beruhten, sollte die Probenahme ohne Ersatz aus der verbleibenden Population die Probenahme ohne Ersatz aus dem Original reproduzieren (stellen Sie sich vor, Sie geben Karten von der Oberseite eines gemischten Decks mit 1000 Karten darin aus; Sie 107 ausgeteilt und innehalten und dann weitere 50 austeilen); Das ist das Gleiche wie 157 auf einmal. Wenn Sie sich jedoch einige der Karten ansehen, die Sie ausgeteilt haben, bevor Sie entscheiden, ob Sie weitere 50 austeilen möchten , handelt es sich nicht um eine zufällige Stichprobe.
Glen_b -Reinstate Monica

Sie haben Recht @Glen_b. Es ist mir peinlich zu sagen, dass ich vor 10 Jahren zu dem gleichen Ergebnis gekommen bin, als eine Umfrageorganisation eine Stichprobe vergrößerte und dann die erste und die zweite Stichprobe mit unterschiedlichen Gewichten übermittelte.
Steve Samuels

Antworten:


4

Korrektur

Ich ziehe die vorherige Antwort (unten) als falsch zurück. @Glen_b ist korrekt. Wenn die zweite Stichprobe nicht auf Ergebnissen in der ersten basiert, beträgt die Gesamtwahrscheinlichkeit der Auswahl , genau wie bei einem SRS (Beweis unten). Außerdem können Sie das Ergebnis als SRS behandeln, obwohl die Größe nicht im Voraus festgelegt wurde.nN

Sie haben jedoch angegeben, dass Sie die zweite Probe genommen haben, weil Sie mehr Präzision benötigen. Wenn Sie die Entscheidung nur getroffen haben, weil die Standardfehler für Schätzungen größer als erwartet waren, ist die Verzerrung der endgültigen geschätzten Standardfehler gering (Hansen, Hurwitz und Madow (1953, S. 77-80) (vorausgesetzt, die anfängliche SE selbst) wurden genau geschätzt). In diesem Fall würde ich die Beobachtungen als von einem SRS stammend behandeln. Wenn Sie jedoch die zweite Stichprobe genommen haben, um einen Grenz-p-Wert auf einen kleineren Wert zu reduzieren, ist eine ernsthafte Verzerrung möglich .

Beweis, dass die Auswahlwahrscheinlichkeit n / N ist:

Sei die Auswahlwahrscheinlichkeit in der ersten Stichprobe und sei die bedingte Auswahlwahrscheinlichkeit in der zweiten Stichprobe: . Sei die endgültige Stichprobengröße. Dann ist die Wahrscheinlichkeit der Auswahl einer Beobachtung für die endgültige Stichprobe:p1=n1Np2p2=n2Nn1n=n1+n2

p=p1+(1p1)p2=n1N+(1n1N)n2Nn1=n1N+Nn1Nn2Nn1=n1+n2N=nN

Referenz : Hansen, MH, WN Hurwitz und W Madow. 1953. Stichprobenerhebungsmethoden und -theorie. Band I Methoden und Anwendungen. New York: Wiley.

Ursprüngliche Antwort:

Diese Art von Problem tritt in der Praxis häufig auf und die Lösung ist ähnlich.

Wie @David Z impliziert, müssen Sie die Möglichkeit systematischer Unterschiede zwischen der ersten und der zweiten Umfrage und den Stichproben untersuchen.

Die resultierende kombinierte Stichprobe kann zwar als zufällig, aber nicht als einfach zufällig angesehen werden . Die Selektionswahrscheinlichkeiten unterscheiden sich zwischen den beiden Proben, daher muss die Analyse gewichtet werden. Sie berechnen Gewichte wie folgt:

Lassen Sie die Nummer in der Bevölkerung sein . Dann ist die Auswahlwahrscheinlichkeit für die ursprüngliche Stichprobe:N

f1=107N

Um in der zweiten Stichprobe ausgewählt zu werden, darf man in der ersten Stichprobe nicht ausgewählt werden. dann in der zweiten ausgewählt werden:

f2=(1f1)50N107

Die Einwaagen wird in Probe 1 und in Probe 2.W=1f1W=1f2

Zur Veranschaulichung sei angenommen , dann werden die Gewichte in der ersten und der zweiten Probe werden und bzw.N=10209.532720.4

Diese Berechnungen müssen geändert werden, wenn in keiner der Proben eine Antwort erfolgte.


0

Es hängt davon ab, ob eine Annahme über die gleiche Verteilung zwischen den verbleibenden 900+ nach dem ersten Probenahmevorgang und den ursprünglichen 1000+ gehalten werden kann. Wenn möglich, können Sie einen Test über den Mittelwert oder die Heteroskedastizität der interessierenden Parameter durchführen.


0

Ich bin mir nicht ganz sicher, wie zufällig diese Stichprobe sein könnte. Ich habe keine großartige Erfahrung mit Statistiken, aber die von Ihnen vorgeschlagene Methode klingt für mich nicht sehr gut. Was ich tun würde, ist, die Stichprobe, die ich aus der gesamten Bevölkerung genommen habe, zurückzusetzen, sie neu zu ordnen und erneut eine Zufallsstichprobe daraus zu ziehen. Oder ich würde einfach eine neue größere Stichprobe aus der Bevölkerung entnehmen und meine Ergebnisse mit der Stichprobe aus dem ersten Versuch vergleichen.

Es könnte eine gute Idee sein, die Einschränkungen zu beschreiben, die Sie haben, z. B. warum Stichproben für Sie teuer sind, damit andere Personen eine ausführlichere Antwort geben können.


Das Problem beim Vergessen der ersten Stichprobe und beim
erneuten
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.