Ich bin ziemlich neu in der Statistik (eine Handvoll Uni-Kurse für Anfänger) und habe mich über Stichproben aus unbekannten Distributionen gewundert. Wenn Sie keine Ahnung von der zugrunde liegenden Verteilung haben, gibt es eine Möglichkeit, zu "garantieren", dass Sie eine repräsentative Stichprobe erhalten?
Beispiel zur Veranschaulichung: Angenommen, Sie versuchen, die globale Verteilung des Wohlstands herauszufinden. Für jede Person kann man irgendwie ihren genauen Reichtum herausfinden; Aber Sie können nicht jede einzelne Person auf der Erde "probieren". Nehmen wir also an, Sie befragen n = 1000 Personen nach dem Zufallsprinzip.
Wenn Ihre Stichprobe Bill Gates nicht enthielt, könnten Sie denken, dass es keine Milliardäre gibt.
Wenn Sie Bill Gates in Ihre Stichprobe aufgenommen haben, könnten Sie denken, dass Milliardäre häufiger sind als sie tatsächlich sind.
In beiden Fällen kann man nicht wirklich sagen, wie häufig oder selten Milliardäre sind. Sie können möglicherweise nicht einmal feststellen, ob überhaupt welche vorhanden sind.
Gibt es für einen solchen Fall einen besseren Stichprobenmechanismus?
Wie würden Sie a priori mitteilen, welches Probenahmeverfahren anzuwenden ist (und wie viele Proben benötigt werden)?
Es scheint mir, dass Sie möglicherweise einen großen Prozentsatz der Bevölkerung "befragen" müssen, um mit hinreichender Sicherheit zu wissen, wie häufig oder selten Milliardäre auf dem Planeten sind, und dass dies darauf zurückzuführen ist, dass die zugrunde liegende Verteilung etwas schwierig ist arbeiten mit.