Sei durch einen dimensionalen Zufallsvektor, dh eine ortsfeste Sammlung von Zufallsvariablen (messbare reelle Funktionen).x=(X1,...,Xj,...,Xk)k−
Betrachten Sie viele solcher Vektoren, sagen wir , und indizieren Sie diese Vektoren mit , also sagen wirni=1,...,n
xi=(X1i,...,Xji,...,Xki)
und betrachte sie als eine Sammlung namens "the sample", . Dann bezeichnen wir jeden dimensionalen Vektor als "Beobachtung" (obwohl dies nur dann tatsächlich der Fall ist, wenn wir die Realisierungen der beteiligten Zufallsvariablen messen und aufzeichnen).
S=(x1,...,xi,...,xn)k−
Lassen Sie uns zunächst den Fall behandeln, in dem entweder eine Wahrscheinlichkeitsmassenfunktion (PMF) oder eine Wahrscheinlichkeitsdichtefunktion (PDF) existiert, und solche Funktionen auch zusammenfassen. Bezeichne mit die gemeinsame PMF oder gemeinsame PDF jedes Zufallsvektors und die gemeinsame PMF oder gemeinsame PDF aller dieser Vektoren zusammen. fi(xi),i=1,...,nf(x1,...,xi,...,xn)
Dann wird die Stichprobe eine "unabhängige Stichprobe" genannt, wenn die folgende mathematische Gleichheit gilt:S
f(x1,...,xi,...,xn)=∏i=1nfi(xi),∀(x1,...,xi,...,xn)∈DS
wobei die gemeinsame Domäne ist, die durch die zufälligen Vektoren / Beobachtungen erzeugt wird.DSn
Dies bedeutet, dass die "Beobachtungen" "gemeinsam unabhängig" sind (im statistischen Sinne oder "unabhängig in der Wahrscheinlichkeit", wie es das alte Sprichwort war, das man heute noch manchmal sieht). Die Gewohnheit ist, sie einfach "unabhängige Beobachtungen" zu nennen.
Beachten Sie, dass die statistische Unabhängigkeitseigenschaft hier über dem Index , dh zwischen den Beobachtungen. Es hängt nicht mit den wahrscheinlichkeitsabhängigen / statistischen Beziehungen zwischen den Zufallsvariablen in jeder Beobachtung zusammen (im allgemeinen Fall behandeln wir hier, wo jede Beobachtung mehrdimensional ist).i
Es ist auch zu beachten, dass in Fällen, in denen wir kontinuierliche Zufallsvariablen ohne Dichten haben, das Obige in Form der Verteilungsfunktionen ausgedrückt werden kann.
Dies ist, was "unabhängige Beobachtungen" bedeutet . Es ist eine genau definierte Eigenschaft, die in mathematischen Begriffen ausgedrückt wird. Mal sehen, was das bedeutet .
EINIGE FOLGEN UNABHÄNGIGER BEMERKUNGEN
A. Wenn zwei Beobachtungen Teil einer Gruppe von gemeinsam unabhängigen Beobachtungen sind, dann sind sie auch "paarweise unabhängig" (statistisch).
f(xi,xm)=fi(xi)fm(xm)∀i≠m,i,m=1,...,n
Dies impliziert wiederum, dass bedingte PMFs / PDFs den "marginalen" entsprechen
f(xi∣xm)=fi(xi)∀i≠m,i,m=1,...,n
Dies verallgemeinert sich auf viele Argumente, zum Beispiel konditioniert oder konditioniert
f(xi,xℓ∣xm)=f(xi,xℓ),f(xi∣xm,xℓ)=fi(xi)
usw., solange sich die Indizes auf der linken Seite von den Indizes auf der rechten Seite der vertikalen Linie unterscheiden.
Dies impliziert, dass sich die Wahrscheinlichkeiten, die eine andere Beobachtung der Probe charakterisieren, nicht ändern, wenn wir tatsächlich eine Beobachtung beobachten. In Bezug auf die Vorhersage ist eine unabhängige Stichprobe nicht unser bester Freund. Wir würden es vorziehen, abhängig zu sein, damit wir mit jeder Beobachtung etwas mehr über jede andere Beobachtung sagen können.
B. Andererseits hat eine unabhängige Stichprobe einen maximalen Informationsgehalt. Da jede Beobachtung unabhängig ist, enthält sie Informationen, die von keiner anderen Beobachtung in der Stichprobe ganz oder teilweise abgeleitet werden können. Die Gesamtsumme ist also maximal, verglichen mit jeder vergleichbaren Stichprobe, bei der zwischen einigen Beobachtungen eine statistische Abhängigkeit besteht. Aber von welchem Nutzen sind diese Informationen, wenn sie uns nicht helfen können, unsere Vorhersagen zu verbessern?
Nun, dies sind indirekte Informationen über die Wahrscheinlichkeiten, die die Zufallsvariablen in der Stichprobe charakterisieren. Je mehr diese Beobachtungen gemeinsame Merkmale aufweisen (in unserem Fall eine gemeinsame Wahrscheinlichkeitsverteilung), desto besser können wir sie aufdecken, wenn unsere Stichprobe unabhängig ist.
Mit anderen Worten, wenn die Stichprobe unabhängig und "identisch verteilt" ist
fi(xi)=fm(xm)=f(x),i≠m
Dies ist die bestmögliche Stichprobe, um nicht nur Informationen über die gemeinsame Wahrscheinlichkeitsverteilung , sondern auch über die Randverteilungen der Zufallsvariablen, aus denen jede Beobachtung besteht, z. B. . f(x)fj(xji)
Auch wenn also , ist die zusätzliche Vorhersagekraft für die tatsächliche Realisierung von mit einer unabhängigen und identisch verteilten Stichprobe gleich Null Position, um die Funktionen (oder einige ihrer Eigenschaften), dh die Randverteilungen , aufzudecken .f(xi∣xm)=fi(xi)xi fi
In Bezug auf die Schätzung (die manchmal als Sammelbegriff verwendet wird, aber hier vom Konzept der Vorhersage unterschieden werden sollte ) ist eine unabhängige Stichprobe daher unser "bester Freund", wenn sie mit der "identisch verteilten" Schätzung kombiniert wird " Eigentum.
C. Daraus folgt auch, dass eine unabhängige Stichprobe von Beobachtungen, bei denen jede durch eine völlig andere Wahrscheinlichkeitsverteilung gekennzeichnet ist und keinerlei gemeinsame Merkmale aufweist, eine Sammlung von Informationen so wertlos ist, wie man sie erhalten kann (natürlich ist jede Information für sich allein Das Problem hierbei ist, dass diese nicht kombiniert werden können, um etwas Sinnvolles zu bieten. Stellen Sie sich eine Probe mit drei Beobachtungen vor: eine enthält (quantitative Merkmale von) Früchten aus Südamerika, eine andere enthält Berge aus Europa und eine dritte enthält Kleidung aus Asien. Ziemlich interessante Informationen, die alle drei zusammengenommen nichts statistisch Nützliches für uns tun können.
Anders ausgedrückt, eine notwendige und ausreichende Bedingung für die Nützlichkeit einer unabhängigen Stichprobe ist, dass die Beobachtungen einige statistische Merkmale gemeinsam haben. Aus diesem Grund ist das Wort "Stichprobe" in der Statistik nicht gleichbedeutend mit "Sammlung von Informationen" im Allgemeinen, sondern mit "Sammlung von Informationen zu Entitäten mit einigen gemeinsamen Merkmalen".
ANWENDUNG AUF DAS DATENBEISPIEL DES OP
Als Antwort auf eine Anfrage von Benutzer @gung betrachten wir das Beispiel des OP im Lichte der obigen Ausführungen. Wir gehen davon aus, dass wir in einer Schule mit mehr als zwei Lehrern und mehr als sechs Schülern sind. Also a) nehmen wir sowohl Schüler als auch Lehrer in die Stichprobe auf und b) nehmen in unseren Datensatz die Note auf, die jeder Lehrer-Schüler-Kombination entspricht.
Die Noten werden nämlich nicht "beprobt", sondern sind eine Folge der Beprobung von Lehrern und Schülern. Daher ist es sinnvoll, die Zufallsvariable (= Note) als "abhängige Variable" zu behandeln, während Schüler ( ) und Lehrer ( "erklärende Variablen" sind (nicht alle möglichen erklärenden Variablen, nur einige ). Unsere Stichprobe besteht aus sechs Beobachtungen, die wir explizit schreiben: asGPTS=(s1,...,s6)
s1=(T1,P1,G1)s2=(T1,P2,G2)s3=(T1,P3,G3)s3=(T2,P4,G4)s4=(T2,P5,G5)s5=(T2,P6,G6)
Unter der Annahme "Schüler beeinflussen sich nicht gegenseitig" können wir die Variablen als unabhängig verteilt betrachten. Unter der Annahme, dass "alle anderen Faktoren", die die Note beeinflussen können, unabhängig voneinander sind, können wir die Variablen auch als unabhängig voneinander betrachten.
Schließlich können wir die Variablen unter der Annahme, dass sich die Lehrer nicht gegenseitig beeinflussen als statistisch unabhängig betrachten.PiGi
T1,T2
Aber unabhängig davon , was kausal / Struktur Annahme wir in Bezug auf die Beziehung zwischen Lehrer machen und Schüler , die Tatsache bleibt , dass Beobachtungen enthalten die gleiche Zufallsvariable ( ), während Beobachtungen enthält auch dieselbe Zufallsvariable ( ). s1,s2,s3T1s4,s5,s6T2
Beachten Sie sorgfältig die Unterscheidung zwischen "derselben Zufallsvariablen" und "zwei unterschiedlichen Zufallsvariablen mit identischen Verteilungen".
Selbst wenn wir davon ausgehen, dass "Lehrer die Schüler NICHT beeinflussen", ist unsere Stichprobe wie oben definiert keine unabhängige Stichprobe, da statistisch durch abhängig sind , während sind statistisch abhängig von . s1,s2,s3T1s4,s5,s6T2
Es wird nun angenommen , dass wir ausschließen , den Zufallsvariable „Lehrer“ aus unserem Beispiel. Ist die Stichprobe (Schüler, Klasse) von sechs Beobachtungen eine unabhängige Stichprobe?
Hier sind die Annahmen von Bedeutung, die wir in Bezug auf die strukturelle Beziehung zwischen Lehrern, Schülern und Noten treffen.
Beeinflussen Lehrer die Zufallsvariable "Note" direkt , vielleicht durch unterschiedliche "Benotungsstile"? Beispielsweise kann ein "harter Grader" sein, während möglicherweise nicht ist. In einem solchen Fall macht das "Nicht-Sehen" der Variablen "Lehrer" die Stichprobe nicht unabhängig, da es nun die sind, die aufgrund einer gemeinsamen Einflussquelle von abhängig sind (und analog für die anderen drei ). T1T2G1,G2,G3T1
Sagen wir aber, dass die Lehrer in dieser Hinsicht identisch sind. Dann haben wir wieder unter der genannten Annahme "Lehrer beeinflussen Schüler", dass die ersten drei Beobachtungen voneinander abhängig sind, weil Lehrer Schüler beeinflussen, die Noten beeinflussen, und wir kommen zu dem gleichen Ergebnis, wenn auch in diesem Fall indirekt (und ebenfalls für die Schüler) andere drei). Die Stichprobe ist also nicht unabhängig.
DER FALL DES GESCHLECHTS
Nun wollen sie die (Schüler, Grad) sechsBeobachtungsProbe machen „bedingt unabhängig in Bezug auf Lehrer“ (siehe andere Antworten) unter der Annahme , dass alle sechs Schüler in Wirklichkeit haben die gleichen Lehrer. Nehmen wir aber zusätzlich die Zufallsvariable " = Geschlecht" in die Stichprobe auf, die traditionell zwei Werte ( ) annimmt , während in letzter Zeit mehr angenommen wurden. Unsere wieder dreidimensionale sechs Beobachtungsprobe ist jetztGeM,F
s1=(Ge1,P1,G1)s2=(Ge2,P2,G2)s3=(Ge3,P3,G3)s3=(Ge4,P4,G4)s4=(Ge5,P5,G5)s5=(Ge6,P6,G6)
Beachten Sie bitte, dass es sich bei dem, was wir in der Beschreibung der Stichprobe in Bezug auf das Geschlecht aufgenommen haben, nicht um den tatsächlichen Wert handelt, den jeder Schüler annimmt, sondern um die Zufallsvariable "Geschlecht" . Schauen Sie sich am Anfang dieser sehr langen Antwort noch einmal um: Die Stichprobe ist nicht als Sammlung von Zahlen (oder festen Zahlen oder nicht Werten im Allgemeinen) definiert, sondern als Sammlung von Zufallsvariablen (dh von Funktionen).
Beeinflusst nun das Geschlecht eines Schülers (strukturell oder statistisch) das Geschlecht des anderen Schülers? Wir könnten vernünftigerweise argumentieren, dass dies nicht der Fall ist. Insofern sind die Variablen unabhängig. das Geschlecht von Schüler , , auf andere Weise direkt einen anderen Schüler ( )? Hmm, es gibt kämpfende Bildungstheorien, wenn ich mich recht erinnere. Also , wenn wir davon ausgehen , dass es funktioniert nicht , dann aus geht es eine weitere mögliche Quelle der Abhängigkeit zwischen Beobachtungen. Hat das Geschlecht eines Schülers direkten Einfluss auf die Noten eines anderen Schülers? Wenn wir das nicht behaupten, erhalten wir eine unabhängige Stichprobe 1 G E 1 P 2 , P 3 , . . .Gei1Ge1P2,P3,... (Voraussetzung ist, dass alle Schüler den gleichen Lehrer haben).