Wie bereits erwähnt, tragen die Erwartungen einfach dazu bei.
Wenn Sie jedoch wissen, dass die Erwartung nicht viel Sinn macht, müssen Sie auch ein Gefühl für die wahrscheinlichen Abweichungen haben.
Es gibt drei Dinge, über die Sie sich Sorgen machen müssen:
Variation in den Individuen um ihre Erwartung herum (eine Person mit einer Wahrscheinlichkeit von 60% zu kommen erreicht ihre Erwartung nicht wirklich; sie ist immer entweder darüber oder darunter)
Abhängigkeit zwischen Menschen. Paare, die beide kommen könnten, tendieren dazu, entweder beide zu besuchen oder keine. Kleine Kinder werden ohne ihre Eltern nicht teilnehmen. In einigen Fällen kann es vorkommen, dass einige Personen nicht kommen, wenn sie wissen, dass eine andere Person anwesend ist.
Fehler bei der Schätzung der Wahrscheinlichkeiten. Diese Wahrscheinlichkeiten sind nur Vermutungen; Vielleicht möchten Sie den Effekt von etwas anderen Vermutungen berücksichtigen (vielleicht die Einschätzung dieser Zahlen durch eine andere Person).
Die erste Methode kann entweder durch normale Näherung oder durch Simulation berechnet werden. Die zweite kann unter verschiedenen Annahmen simuliert werden, entweder spezifisch für die Personen oder unter Berücksichtigung einer gewissen Verteilung der Abhängigkeiten. (Der dritte Punkt ist schwieriger.)
Bearbeitet, um nachfolgende Fragen in Kommentaren zu beantworten:
Wenn ich Ihre Formulierung richtig verstehe, haben Sie für die 4-köpfige Familie eine 50% ige Chance, dass 4 Personen oder keine kommen. Das ist sicherlich eine erwartete Zahl von 2, aber Sie möchten auch eine Vorstellung von der Variabilität um die Erwartung haben. In diesem Fall möchten Sie wahrscheinlich die tatsächliche Situation von 50% von 0/50% von 4 beibehalten.
Wenn Sie jeden in unabhängige Gruppen aufteilen können, wäre eine gute erste Annäherung (mit vielen solcher Gruppen), die Mittelwerte und Varianzen über unabhängige Gruppen zu addieren und die Summe dann wie normal zu behandeln (möglicherweise mit Kontinuitätskorrektur). Ein genauerer Ansatz wäre, den Prozess zu simulieren oder die Verteilung durch numerische Faltung genau zu berechnen. Beide Ansätze sind unkompliziert, dies ist jedoch ein unnötiges Maß an Präzision für diese spezielle Anwendung, da es bereits so viele Approximationsschichten gibt - es ist, als würde man die Abmessungen eines Raums auf den nächsten Fuß genau bestimmen und dann berechnen, wie viel Farbe Sie benötigen auf den nächsten Milliliter genau - die zusätzliche Präzision ist sinnlos.
Stellen Sie sich vor (der Einfachheit halber), wir hätten vier Gruppen:
1) Gruppe A (1 Person) - 70% Teilnahmechance
2) Gruppe B (1 Person) - 60% Teilnahmechance
3) Gruppe C (4-köpfige Familie) - 0: 0,5 4: 0,5 (wenn jemand zu Hause bleibt, kommt keiner)
4) Gruppe D (2er-Paar) - 0: 0,4 1: 0,1 2: 0,5 (dh 50% Chance von beiden, plus 10% Chance, dass genau einer kommt, z. B. wenn der andere Arbeitseinsätze hat oder krank ist)
Dann erhalten wir folgende Mittel und Abweichungen:
mean variance
A 0.7 0.21
B 0.6 0.24
C 2.0 4.0
D 1.1 0.89
Tot 4.4 5.34
Eine normale Annäherung ist in diesem Fall ziemlich grob, würde jedoch darauf hindeuten, dass mehr als 7 Personen ziemlich unwahrscheinlich sind (in der Größenordnung von 5%), und 6 oder weniger würden in etwa 75-80% der Fälle auftreten.
[Ein genauerer Ansatz wäre, den Prozess zu simulieren, aber das vollständige Problem und nicht das reduzierte Beispiel sind wahrscheinlich unnötig, da es bereits so viele Approximationsebenen gibt.]
Wenn Sie eine kombinierte Verteilung haben, die solche Gruppenabhängigkeiten enthält, möchten Sie möglicherweise alle Quellen einer gemeinsamen Abhängigkeit (z. B. Unwetter) anwenden - oder Sie möchten solche Eventualitäten einfach versichern oder sogar ignorieren, je nach den Umständen .