Eine zufällige Bevölkerungsstichprobe wurde erhoben. Sie wurden gefragt, ob sie vegetarisch essen. Wenn sie mit Ja geantwortet haben, wurden sie auch gebeten, anzugeben, wie lange sie ohne Unterbrechung vegetarisch ernährt haben. Ich möchte diese Daten verwenden, um die durchschnittliche Dauer der Einhaltung des Vegetarismus zu berechnen. Mit anderen Worten, wenn jemand Vegetarier wird, möchte ich wissen, dass er im Durchschnitt lange vegetarisch bleibt. Nehmen wir an, dass:
- Alle Befragten gaben korrekte und genaue Antworten
- Die Welt ist stabil: Die Popularität des Vegetarismus ändert sich nicht, auch die durchschnittliche Dauer der Einhaltung ändert sich nicht.
Meine bisherigen Überlegungen
Ich fand es hilfreich, ein Spielzeugmodell der Welt zu analysieren, bei dem zu Beginn eines jeden Jahres zwei Menschen Vegetarier werden. Jedes Mal bleibt einer von ihnen 1 Jahr lang vegetarisch und der andere 3 Jahre lang. Offensichtlich beträgt die durchschnittliche Dauer des Beitritts in dieser Welt (1 + 3) / 2 = 2 Jahre. Hier ist ein Diagramm, das das Beispiel veranschaulicht. Jedes Rechteck repräsentiert eine Periode des Vegetarismus:
Nehmen wir an, wir machen eine Umfrage in der Mitte des vierten Jahres (rote Linie). Wir erhalten folgende Daten:
Wir würden die gleichen Daten erhalten, wenn wir an der Umfrage zu einem beliebigen Zeitpunkt ab dem dritten Jahr teilnehmen würden.
(2 × 0,5 + 1,5 + 2,5) / 4 = 1,25
Wir unterschätzen, weil wir davon ausgehen, dass alle gleich nach der Umfrage aufgehört haben, Vegetarier zu sein, was offensichtlich falsch ist. Um eine Schätzung zu erhalten, die näher an der tatsächlichen Durchschnittszeit liegt, in der diese Teilnehmer vegetarisch bleiben würden, können wir davon ausgehen, dass sie im Durchschnitt eine Zeit etwa in der Mitte ihrer Vegetarismusperiode angegeben und die angegebene Dauer mit 2 multipliziert haben Von der Bevölkerung (wie die, die ich analysiere) halte ich dies für eine realistische Annahme. Zumindest würde es einen korrekten Erwartungswert geben. Wenn wir jedoch nur das Doppelte tun, erhalten wir einen Durchschnitt von 2,5, was eine Überschätzung darstellt. Dies liegt daran, dass je länger eine Person vegetarisch bleibt, desto wahrscheinlicher ist es, dass sie in der Stichprobe der derzeitigen Vegetarier ist.
Ich dachte dann, dass die Wahrscheinlichkeit, dass jemand in der Stichprobe der gegenwärtigen Vegetarier ist, proportional zu ihrer Länge des Vegetarismus ist. Um diese Tendenz zu berücksichtigen, habe ich versucht, die Anzahl der derzeitigen Vegetarier durch ihre vorhergesagte Dauer der Einhaltung zu dividieren:
Dies ergibt jedoch auch einen falschen Durchschnitt:
(2 * 1 + ⅓ * 3 + ⅕ * 5) / (2 + ⅓ + ⅕) = 4 / 2,533333 = 1,579 Jahre
Es würde die richtige Schätzung geben, wenn die Anzahl der Vegetarier durch ihre korrekte Länge der Einhaltung geteilt würde:
(1 + ⅓ * (1 + 3 + 5)) / (1 + ⅓ * 3) = 2 Jahre
Aber es funktioniert nicht, wenn ich vorhergesagte Längen der Einhaltung verwende und sie sind alles, was ich in der Realität habe. Ich weiß nicht, was ich sonst noch versuchen soll. Ich habe etwas über die Überlebensanalyse gelesen, bin mir aber nicht sicher, wie ich sie in diesem Fall anwenden soll. Idealerweise möchte ich auch ein 90% -Konfidenzintervall berechnen können. Alle Tipps wäre sehr dankbar.
EDIT: Es ist möglich, dass die Frage oben keine Antwort hat. Es gab aber auch eine andere Studie , in der eine zufällige Auswahl von Personen befragt wurde, ob sie Vegetarier sind / waren und wie oft sie in der Vergangenheit Vegetarier waren. Ich kenne auch das Alter von jedem in beiden Studien und einigen anderen Dingen. Vielleicht können diese Informationen in Verbindung mit der Befragung aktueller Vegetarier verwendet werden, um den Mittelwert irgendwie zu ermitteln. In Wirklichkeit ist die Studie, über die ich gesprochen habe, nur ein Teil des Puzzles, aber sie ist sehr wichtig, und ich möchte mehr daraus machen.