Stichprobenmodell für Crowdsourcing-Daten?

Ich arbeite an einem offenen Antrag für eine Gesundheitsumfrage, der in Entwicklungsländern verwendet werden soll.

Die Grundidee ist, dass Umfrageinterviews vom Crowdsourcing-Team durchgeführt werden - sie werden von nicht organisierten Freiwilligen durchgeführt, die Formulardaten der Interviews übermitteln, die sie mit ihren Mobilgeräten durchgeführt haben, und jede Umfrage wird von den GPS-Daten des Interviewstandorts begleitet.

Traditionelle Umfragen, die von Regierungsbehörden zusammengestellt wurden, werden normalerweise mit einem Standardstichprobenmodell durchgeführt - normalerweise einem Wahrscheinlichkeitsstichprobenmodell. Dies erfordert viel zentralisierte Planung, die nicht immer durchgeführt werden kann. (erwähnte dies, um meine Frage in den richtigen Kontext zu stellen)

Wir können sagen, dass ein Freiwilliger eine Bequemlichkeitsprobe in seinem Gebiet durchführen wird. Er wird beliebig viele Leute interviewen, die er erreichen kann.

Das Grundproblem ist: Wie kann das Gesamtstichprobenmodell dieses Vermessungssystems verstanden und charakterisiert werden? Gibt es Methoden oder zusammengesetzte Modelle, um mit solchen Fällen umzugehen?

sampling

— al-Amjad Tawfiq Isstaif
quelle

Kurze Antwort: Dies ist ein praktisches Beispiel. Sie können nichts tun, um dies zu rechtfertigen.

Eine etwas längere Antwort: Sie sitzen im selben Boot wie viele soziale Netzwerke, die ihre internen Umfragen durchführen, ohne eine genaue Vorstellung davon zu haben, wer auf eine Umfrage mit einer Frage antworten würde, die zufällig auf Facebook oder Google + angezeigt wird Ich habe keine Daten über diejenigen, die nicht geantwortet haben. Die Umfrage- und Meinungsforschungsgemeinschaft ist im Allgemeinen gegen diese Art von Arbeit, da es überhaupt nicht klar ist, wie die Ergebnisse dieser stark voreingenommenen Stichprobe auf die Gesamtbevölkerung (wenn überhaupt) verallgemeinert werden können. Sie können versuchen, gemäß den bekannten demografischen Merkmalen neu zu gewichten, aber dann erhalten Sie eine Variation der Gewichte von 1 für eine Person, die sich nur bis zu 1.000.000 darstellt, die dem einzigen über 70-jährigen Mann in der Bevölkerung zugeordnet sind, der weiß, wie man einen Computer verwendet (und ist wahrscheinlich sowieso nicht repräsentativ für die verbleibenden 1.000.000 über 70 Männer).

Zusätzliche Lektüre: "How To Lie With Statistics" beginnt mit einem Kapitel über voreingenommene Stichproben. Wenn Sie es lesen können und nicht frustriert über Ihr Musterdesign weinen, können Sie weitermachen. Wenn Sie sich auf Freiwillige verlassen, ist Ihre Stichprobe auf junge und städtische Bevölkerungsgruppen ausgerichtet, die besseren Zugang zu elektronischen Geräten haben. Ebenso eröffnet die Broschüre "What is a Survey", die Fritz Scheuren, ehemaliger Präsident der American Statistical Association, zusammengestellt hat, das Bild von Harry Truman, dessen Sieg mit den damals existierenden voreingenommenen Umfragetechniken nicht vorhergesagt werden konnte.

Es gibt einige Untersuchungen zu schwer erreichbaren Bevölkerungsgruppen . Ein bekanntes Projekt war eine Studie über die Anzahl der übermäßigen Todesfälle im Irak, in denen geografische Gebiete untersucht wurden, und in jedem Gebiet versuchte der örtliche Arzt, Interviews von jedem Haushalt im Stadtblock zu erhalten. Die Kritik an diesem Design hat zugenommen, aber so kompromissbereit es auch war, es hatte immer noch seine Sampling-Komponente. Siehe Artikel in Lancet (wie Sie wahrscheinlich wissen, können Sie in der medizinischen Welt keinen besseren Ruf erlangen) http://dx.doi.org/10.1016/S0140-6736(04)17441-2 und http: //dx.doi .org / 10.1016 / S0140-6736 (06) 69491-9 .

— StasK
quelle

(+1) Gibt es hier etwas grundlegend anderes als die Quotenauswahl ? Nur neugierig, eine flüchtige Lektüre der Frage lässt sie wie eine Änderung der Terminologie aussehen. Kurz gesagt, was sind die Hauptkritikpunkte der Irak-Cluster-Stichprobenstudie? Ich erinnere mich, wie ich das sah, als es zum ersten Mal herauskam und ein bisschen darüber las.

— Kardinal

Ich nehme an, ein Unterschied ist, dass es keine Quote pro Person gibt ...;)

— Kardinal

Vielen Dank! Jetzt habe ich ein gutes Verständnis, bevor ich die Idee neu entwerfe!

— Al-Amjad Tawfiq Isstaif

en.wikipedia.org/wiki/Lancet_surveys_of_Iraq_War_casualties

— StasK

Ich denke, es gab Probleme mit der geringen Anzahl von Clustern, und ein Cluster endete mit einem Ausreißer, bei dem die militärische Aktivität viel höher war als anderswo im Land. Für mich wären als erstes die Aussagen von AAPOR und ASA zur Studie zu betrachten. Während Lancet vielleicht ein großartiges medizinisches Fachjournal ist und John Hopkins, ein großartiges medizinisches Fachjournal, die AAPOR-Autorität beschnüffelt und ihnen die Methodendokumente verweigert, war dies einfach unprofessionell.

— StasK