Beispiele für Prozesse, die nicht Poisson sind?


15

Ich suche einige gute Beispiele für Situationen, die für das Modellieren mit einer Poisson-Verteilung ungeeignet sind, um den Schülern die Erklärung der Poisson-Verteilung zu erleichtern.

Üblicherweise wird die Anzahl der Kunden, die in einem Zeitintervall in einem Geschäft eintreffen, als Beispiel verwendet, das durch eine Poisson-Verteilung modelliert werden kann. Ich suche ein Gegenbeispiel in ähnlicher Weise, dh eine Situation, die als positiver Zählvorgang in kontinuierlicher Zeit angesehen werden kann, die eindeutig nicht Poisson ist.

Die Situation sollte idealerweise so einfach und unkompliziert wie möglich sein, um es den Schülern zu erleichtern, sie zu erfassen und sich zu erinnern.


5
Diese Frage ist außerordentlich weit. Sofern der Geltungsbereich nicht eingeschränkt und ein weiterer Kontext hinzugefügt wird, ist es sehr wahrscheinlich, dass er geschlossen wird. Ohne unnötig harsch zu klingen, ist es vergleichbar mit der Frage: "Was sind einige Beispiele für Blumen, die nicht rot sind?" (Cue Harry Chapin.)
Kardinal

1
Punkt genommen. Entschuldigen Sie. Ich hätte es präzisieren sollen. Ich habe es bearbeitet, um es klarer zu machen.
Nagel

1
(+1) auf die Frage und den Kommentar. Das Update ist viel besser. :-)
Kardinal

2
Ich nehme an, Sie meinen "gegebene Prozesse, für die die Leute ein Poisson zumindest naiv in Betracht ziehen könnten" (z. B. zumindest einen Zählprozess). Ein häufig anzutreffendes Beispiel ist die Anzahl der Schadenfälle bei allgemeinen Versicherungsverträgen (P & C-Versicherungen), die sich aufgrund einer Reihe möglicher Faktoren am deutlichsten in der Heterogenität der Schadenfälle niederschlägt. Es gibt also eine Überlagerung von Poisson-Prozessen mit unterschiedlicher Intensität. In Situationen, in denen die Verteilung der Schadensquoten durch eine Gamma-Verteilung gut angenähert wird, wird die Verteilung der Schadensquoten wiederum durch ein negatives Binomial angenähert.
Glen_b -Reinstate Monica

Antworten:


5

Anzahl der Zigaretten, die in einem bestimmten Zeitraum geraucht wurden: Dies erfordert einen Prozess ohne Luftdruck (z. B. Poisson ohne Luftdruck oder negatives Binomial ohne Luftdruck), da nicht jeder Zigaretten raucht.


Vielen Dank! Viele hier haben Prozesse ohne Inflation erwähnt, aber ich denke, dies ist das einfachste und anschaulichste Beispiel: Die Anzahl der Zigaretten, die von einer zufällig ausgewählten Person in einem bestimmten Zeitraum geraucht wurden.
Nagel

Es gibt wohl ein Problem mit dem Argument "Nicht jeder raucht Zigaretten", aber man könnte behaupten, dass dieser Prozess immer noch Poisson ist, nur dass der Intensitätsparameter für jede Person spezifisch und unbekannt ist (Nichtraucher hätten einen sehr kleinen Intensität) - richtig? Man könnte jedoch auch argumentieren, dass diese Situation die Poisson-Vermutungen verletzt, indem die gerauchten Zigaretten tendenziell gleichmäßig über den Tag (für normale Raucher) oder die Gruppe (für soziale Raucher) verteilt werden, so dass unzusammenhängende Zeitintervalle nicht unabhängig sind. Das ist also immer noch ein gutes Beispiel, denke ich.
Nagel

1
Die Anzahl der in einem bestimmten Zeitraum gefangenen Fische ist meines Erachtens ein kanonischeres Beispiel für ZIP und ZINB. Ähnliche Argumente. Fisch hat jedoch nicht das Potenzial, süchtig zu machen, was die Konsumrate angeht. (Ich weiß, ich weiß, mit Ausnahme von Fisch Ihrer Mutter, denn sie sind die gut :).
Alexis

8

Meinen Sie damit positive Zähldaten? Grenzenlos?

Das negative Binomial ist beliebt.

Ein weiteres gutes Modell ist das Poisson mit aufgeblähter 0. Dieses Modell geht davon aus, dass entweder etwas passiert oder nicht - und wenn ja, folgt es einem Poisson. Ich habe kürzlich ein Beispiel gesehen. Krankenschwestern, die AIDS-Patienten behandelten, wurden gefragt, wie oft sie aufgrund ihrer Beteiligung an AIDS-Patienten stigmatisierende Verhaltensweisen von anderen erfahren haben. Eine große Anzahl hatte noch nie solche Erfahrungen gemacht, möglicherweise weil sie dort gearbeitet oder gelebt hatten. Von denen, die dies taten, war die Anzahl der stigmatisierenden Erlebnisse unterschiedlich. Es wurden mehr Nullen gemeldet, als Sie von einem reinen Poisson erwarten würden, im Grunde genommen, weil sich ein bestimmter Teil der untersuchten Gruppe nicht in einer Umgebung befand, in der sie solchen Verhaltensweisen ausgesetzt waren.

Eine Mischung aus Poisson würde Ihnen auch einen Punktprozess geben.


(+1) für die null-aufgeblasene Poisson-Verteilung. Eine Diskussion zu diesem Modell finden Sie hier

1
+1 auf diese (und andere Antworten), die tatsächliche Beispiele für die in der Frage genannten Situationen liefern , und nicht nur abstrakte Verteilungen. Dieses Beispiel der ZIP ist besonders deutlich.
Whuber

1
Zu Ehren derjenigen, die geantwortet haben, sollte ich darauf hinweisen, dass meine Frage anfangs viel zu schlampig war und sich überhaupt nicht auf Situationen bezog. Ich bin damit einverstanden, dass der Poisson ohne Luftdruck ein gutes Beispiel ist. Allerdings finde ich es ein wenig zu kompliziert, Studenten zu erklären, weshalb ich immer noch Beispiele für einfache Situationen vermisse, die mit einer Poisson-Verteilung nicht modelliert werden können.
Nagel

4

Zählen von Prozessen, die nicht Poisson sind? Nun, jeder endliche Probenraumprozess wie binomial oder diskret uniform. Sie erhalten einen Poisson-Zählprozess, wenn Sie Ereignisse mit unabhängigen Interarrival-Zeiten zählen, die exponentiell verteilt sind, sodass eine ganze Reihe von Verallgemeinerungen davon abweichen, z Verteilung.


Vielen Dank für Ihre Antwort, und es tut mir sehr leid, dass meine Frage anfangs so unklar war. Ich habe es jetzt geklärt. Was Sie über Prozesse mit nicht exponentiellen und / oder abhängigen Interarrival-Zeiten sagen, ist sinnvoll. Haben Sie jedoch Beispiele für Situationen, die diese Eigenschaften aufweisen, je einfacher desto besser?
Nagel

4
Wetten Sie? Zeit zwischen den Ausbrüchen des Herpesvirus. Sie haben eine viel längere Zeit bis zu Ihrem ersten Ausbruch, da Sie sich tatsächlich mit dem Virus infizieren müssen. Ihre Interarrival-Zeiten zwischen den Ausbrüchen danach sind unabhängig voneinander, sind jedoch im Vergleich zum Index-Ausbruch viel schneller. Nichtexponentielle interarrival Zeiten sind die Norm. In der Überlebensanalyse werden häufig Cox-Proportional-Hazards-Modelle verwendet, bei denen Sie alle parametrischen Annahmen über die Interarrival-Zeiten entfernen.
AdamO

Gutes Beispiel! Ich vermute, dies ist ein weiteres Beispiel für das von Placidia oben erwähnte null-aufgepumpte Poisson?
Nagel

4

Es ist unklar, ob Sie Prozesse zählen möchten oder nicht.

Wenn ich das "Teaching" -Tag so interpretiere, dass Sie den Poisson-Prozess unterrichten, ist der Bernoulli-Prozess für das Unterrichten eines Prozesses im Allgemeinen ein einfacher, zufälliger Prozess, der zu erklären und zu visualisieren ist und mit dem Poisson-Prozess zusammenhängt. Der Bernoulli-Prozess ist das diskrete Analogon, daher könnte er ein hilfreiches Begleitkonzept sein. Es ist nur so, dass wir anstelle von kontinuierlicher Zeit diskrete Zeitintervalle haben.

Ein Beispiel könnte ein Verkäufer von Tür zu Tür sein, bei dem wir die Erfolge von Haushalten zählen, die einen Kauf tätigen.

  • Die Anzahl der Erfolge in den ersten n Versuchen hat eine Binomialverteilung
    B (n, p) anstelle eines Poisson
  • Die Anzahl der Versuche, die erforderlich sind, um r Erfolge zu erzielen, hat eine negative Binomialverteilung NB (r, p) anstelle einer Gammaverteilung
  • Die Anzahl der Versuche, die erforderlich sind, um einen Erfolg zu erzielen, die Wartezeit, hat eine geometrische Verteilung NB (1, p), die das diskrete Analogon des Exponentials ist.

Das ist der Ansatz, den Bertsekas und Tsitsiklis in Introduction To Probability , 2nd ed., Verwenden , um den Bernoulli-Prozess vor dem Poisson-Prozess einzuführen. In ihrem Lehrbuch finden sich weitere Erweiterungen des Bernoulli-Prozesses, die auf den Poisson-Prozess anwendbar sind, z. B. das Zusammenführen oder Partitionieren dieser Prozesse sowie Probleme mit Lösungsansätzen.

Wenn Sie nach Beispielen für zufällige Prozesse suchen und nur die Namen herauswerfen möchten, gibt es einige.

Der Gauß-Prozess ist in Anwendungen von Bedeutung. Insbesondere der Weiner-Prozess, der eine Art Gauß-Prozess ist, wird auch als Brownsche Standardbewegung bezeichnet und findet Anwendung in den Bereichen Finanzen und Physik.


Vielen Dank für Ihre Antwort, und es tut mir sehr leid, dass meine Frage anfangs so einfach und unklar war. Ich habe jetzt versucht, es zu klären. Die Verbindung von Bernoulli nach Poisson ist interessant, aber was ich suche, sind Beispiele für Situationen in kontinuierlicher Zeit, die sich nicht für eine Poisson-Verteilung eignen. Je einfacher, desto besser.
Nagel

3

Als Versicherungsmathematiker für Sach- und Unfallversicherungen beschäftige ich mich ständig mit Beispielen aus der Praxis diskreter Prozesse, die nicht von Poisson stammen. Für Geschäftsbereiche mit hohem Schweregrad und niedriger Frequenz ist die Poisson-Verteilung ungeeignet, da sie ein Varianz-Mittelwert-Verhältnis von 1 erfordert. Die oben erwähnte negative Binomialverteilung wird viel häufiger verwendet, und die Delaporte-Verteilungen wird in einigen Literaturstellen verwendet, in der nordamerikanischen versicherungsmathematischen Standardpraxis jedoch seltener.

Warum das so ist, ist eine tiefere Frage. Ist das negative Binom so viel besser, weil es einen Poisson-Prozess darstellt, bei dem der mittlere Parameter selbst gammaverteilt ist? Oder liegt es daran, dass Schadensereignisse nicht unabhängig sind (wie es nach derzeitigem Kenntnisstand bei Erdbeben der Fall ist: Je länger auf das Rutschen der Erde gewartet wird, desto wahrscheinlicher ist es, dass sich Druck aufbaut), desto instationärer ist es (die Intervalle) können nicht in Sequenzen unterteilt werden, von denen jede stationär ist, was die Verwendung eines inhomogenen Poisson ermöglichen würde. Einige Geschäftsbereiche erlauben mit Sicherheit das gleichzeitige Auftreten (z. B. Behandlungsfehler mit mehreren Ärzten, die von der Police abgedeckt sind).


2

Andere haben einige Beispiele von Punktprozessen erwähnt, die nicht Poisson sind. Da der Poisson exponentiellen Interarrival-Zeiten entspricht, wenn Sie eine nicht exponentielle Interarrival-Zeitverteilung auswählen, ist der resultierende Punktprozess kein Poisson. AdamO wies auf die Weibull hin. Sie können Gamma, Lognormal oder Beta als mögliche Optionen verwenden.

Der Poisson hat die Eigenschaft, dass sein Mittelwert gleich seiner Varianz ist. Ein Punktprozess, dessen Varianz größer als der Mittelwert ist, wird manchmal als überdispers bezeichnet. Wenn der Mittelwert größer als die Varianz ist, ist er unterdispers. Diese Begriffe werden verwendet, um den Prozess mit einem Poisson in Beziehung zu setzen. Das negative Binom wird häufig verwendet, da es abhängig von seinen Parametern über- oder unterdispers sein kann.

Der Poisson hat eine Varianz, die konstant ist. Ein Punktprozess, der den Poisson-Bedingungen entspricht, außer dass er keinen konstanten Ratenparameter und folglich einen zeitlich variierenden Mittelwert und eine Varianz aufweist, wird inhomogenes Poisson genannt.

Ein Prozess mit exponentiellen Interarrival-Zeiten, der jedoch zur Ankunftszeit mehrere Ereignisse aufweisen kann, wird als zusammengesetztes Poisson bezeichnet. Obwohl sie dem Poisson-Prozess ähnlich sind und einen Namen mit dem Wort Poisson enthalten, unterscheiden sich inhomogene und zusammengesetzte Poisson-Prozesse von einem Poisson-Punkt-Prozess.


Vielen Dank für Ihre Antwort, und es tut mir sehr leid, dass meine Frage anfangs so einfach und unklar war. Ich habe jetzt versucht, es zu klären. Sie erwähnen Prozesse mit nicht exponentiellen und / oder abhängigen Interarrival-Zeiten, und was Sie über über- und unterdisperse Verteilungen sagen, ist sehr interessant. Haben Sie jedoch Beispiele für konkrete Situationen, die diese Eigenschaften haben werden? Je einfacher, desto besser :)
Nagel

1
Anstatt zu versuchen, meine eigene Antwort zu geben, denke ich, dass es wirklich viele, viele Beispiele gibt, die Sie in Büchern finden können, die sich mit Zählprozessen befassen. Ich empfehle Ihnen, Joe Hilbes Buch über die negative binomische Regression zu lesen .
Michael R. Chernick

2

Ein weiteres interessantes Beispiel für einen Nicht-Poisson-Zählprozess ist die Null-Poisson-Verteilung (ZTPD). ZTPD kann Daten in Bezug auf die Anzahl der Sprachen, in denen die Probanden unter physiologischen Bedingungen sprechen können, anpassen. In diesem Fall verhält sich die Poisson-Verteilung schlecht, da die Anzahl der gesprochenen Sprachen per Definition> = 1 ist: daher ist 0 von vornherein ausgeschlossen.


2

Ich glaube, Sie könnten Ihren Poisson-Prozess zur Kundenankunft auf zwei verschiedene Arten optimieren: 1) Die Kundenankünfte werden rund um die Uhr gemessen, aber der Laden ist nicht den ganzen Tag geöffnet. 2) Stellen Sie sich zwei konkurrierende Läden vor Poisson verarbeitet die Ankunftszeiten der Kunden und untersucht den Unterschied zwischen den Ankünften in den beiden Filialen. (Beispiel 2 stammt aus meinem Verständnis des Springer-Handbuchs für technische Statistik, Teil A, Eigenschaft 1.4.)


1

Vielleicht möchten Sie das Fußballbeispiel noch einmal überdenken. Es scheint, dass die Trefferquoten für beide Teams im Laufe des Spiels steigen und sich ändern, wenn die Teams ihre Angriffs- / Verteidigungsprioritäten als Reaktion auf die aktuelle Punktzahl ändern.

Oder verwenden Sie es als Beispiel dafür, wie einfache Modelle überraschend gute Leistungen erbringen, das Interesse an statistischen Untersuchungen zu bestimmten Phänomenen wecken und einen Maßstab für zukünftige Studien liefern, die mehr Daten zur Untersuchung von Diskrepanzen sammeln und Ausarbeitungen vorschlagen.

Dixon & Robinson (1998), "Ein Geburtsmodell für Vereinsfußballspiele", The Statistician , 47 , 3.


Ich hatte eine Ahnung, dass Fußballspiele nicht ganz Poisson waren, aber danke für den Hinweis :)
Nagel

1

Da es um die Frage geht, die Poisson-Verteilung verständlicher zu machen, werde ich es versuchen, da ich vor kurzem etwas nach Callcenter-Anrufmustern gesucht habe (die mit der Zeit einer speicherlosen, exponentiellen Verteilung folgen).

Ich denke, dass ich mich in ein anderes Tangentialmodell vertiefen muss, das im Wesentlichen die Kenntnis von Poisson erfordert, um zu erkennen, dass es nicht eines ist, das vielleicht etwas verwirrend ist, aber das bin nur ich.

Ich denke, das Problem beim Verstehen von Poisson ist die kontinuierliche Zeitachse, auf der es liegt - da jede Sekunde weitergeht, ist es unwahrscheinlich, dass das Ereignis auftritt -, aber je weiter Sie in der Zukunft fortfahren, desto sicherer ist es Ereignis.

Wirklich, ich denke, es vereinfacht das Verständnis, wenn Sie nur die Zeitachse gegen 'Prüfungen' oder 'Ereignisse' tauschen.

Jemand kann mich korrigieren, wenn dies weit von der Basis entfernt ist, da es meiner Meinung nach eine einfache Erklärung ist, aber ich denke, Sie können den Münzwurf oder das Werfen eines Würfels durch "Zeit bis zum Eintreffen eines Telefonanrufs" ersetzen (was ich meine) in der Regel für Erlang C / Call-Center-Personal verwenden).

Anstelle von "Zeit bis ein Anruf eintrifft" ---- können Sie ihn durch ... "Würfeln bis ein Würfel sechs trifft" ersetzen.

Das folgt der gleichen allgemeinen Logik. Die Wahrscheinlichkeit (wie bei jedem Glücksspiel) ist bei jedem Wurf (oder jeder Minute) völlig unabhängig und speicherlos. Die Wahrscheinlichkeit von „Nr. 6“ sinkt jedoch mit zunehmender Anzahl von Versuchen immer langsamer, aber sicher gegen 0. Es ist einfacher, wenn Sie beide Grafiken sehen (Wahrscheinlichkeit eines Anrufs mit der Zeit im Vergleich zur Wahrscheinlichkeit von sechs mit Würfeln).

Ich weiß nicht, ob das Sinn macht - das hat mir geholfen, es konkret zu fassen. Nun ist die Poisson-Verteilung eher eine Zählung als eine Zeit zwischen Anrufen oder Versuchen, bis eine Sechs gewürfelt wird - aber sie beruht auf dieser Wahrscheinlichkeit.


Ich kann sehen, wie Sie denken, dass dies für die Studenten verwirrend sein könnte, aber meine Idee war einfach, dass es mir leichter fallen würde zu erklären, warum die Anzahl der Kunden, die in einem Zeitintervall in ein Restaurant kommen, Poisson ist, wenn ich einen Schalter hätte -Beispiel eines einfachen Prozesses mit diskreten Ereignissen in kontinuierlicher Zeit, der nicht Poisson war.
Nagel

1
Es gibt viele Möglichkeiten, denke ich. Ein offensichtliches Muster wären Ereignisse, deren Wahrscheinlichkeit mit ihrem eigenen Auftreten zunimmt oder abnimmt. Es ist schwer, an einige Beispiele zu denken. Vielleicht kommen Ameisen in Ihrer Küche / Ihrem Picknick an. Die Zeit, die die Ankunft der ersten Ameise benötigt, ist wahrscheinlich viel länger als die der zweiten oder dritten Ameise, und natürlich bedeuten mehr Ameisenankünfte wahrscheinlichere zukünftige Ameisenankünfte (vorausgesetzt, ihre Spuren / Kommunikation untereinander). Ich bin mir nicht sicher, ob das zählen würde.
John Babson

1

Anzahl der Besuche eines einzelnen Kunden im Lebensmittelgeschäft innerhalb eines bestimmten Zeitintervalls.

Nachdem Sie im Lebensmittelgeschäft waren, ist es unwahrscheinlich, dass Sie für eine Weile zurückkehren, es sei denn, Sie haben einen Planungsfehler begangen.

Ich denke, dass die negative Binomialverteilung hier verwendet werden könnte, aber sie ist diskret, wohingegen die Besuche in kontinuierlicher Zeit erfolgen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.