Solange die Verteilung des Merkmals, mit dem Sie Einheiten in der Stichprobe auswählen, orthogonal zur Verteilung des Merkmals der Population ist, die Sie schätzen möchten, können Sie eine unvoreingenommene Schätzung der Populationsmenge erhalten, indem Sie die Auswahl darauf konditionieren. Die Stichprobe ist nicht rein zufällig . Die Leute neigen jedoch dazu zu übersehen, dass Zufallsstichproben gut sind, da die Zufallsvariable, die zur Auswahl von Einheiten in Stichproben verwendet wird, orthogonal zur Verteilung der Populationsmerkmale ist, nicht, weil sie zufällig ist.
Stellen Sie sich vor, Sie zeichnen zufällig aus einem Bernoulli mit P (invlogit (x_i)), wobei x_i in [-inf, inf] ein Merkmal der Einheit i ist, sodass Cov (x, y)! = 0 und y das Populationsmerkmal ist, dessen meine du willst schätzen. Die Stichprobe ist "zufällig" in dem Sinne, dass Sie vor der Auswahl in die Stichprobe zufällig wählen. Die Stichprobe liefert jedoch keine unvoreingenommene Schätzung des Populationsmittels von y.
Was Sie brauchen, ist die Konditionierung der Auswahl in Stichproben für eine Variable, die so gut wie zufällig zugewiesen ist . Das heißt, das ist orthogonal zu der Variablen, von der die interessierende Größe abhängt. Randomisierung ist gut, weil sie Orthogonalität gewährleistet und nicht aufgrund von Randomisierung.