Wenn A gleichmäßig auf [8,10] und B auf [9,11] verteilt ist, wie hoch ist die Wahrscheinlichkeit, dass B <A ist?


7

Diese Frage wurde mir in einem Interview gestellt und ich habe sie anfangs nicht richtig beantwortet, obwohl ich immer noch denke, dass meine Interpretation die richtige gewesen sein könnte. Die Frage war:

Es gibt zwei Lieferwagen, A und B. A liefert zwischen 8 und 10 Uhr und B zwischen 9 und 11 Uhr. Die Lieferungen sind für beide gleichmäßig verteilt. Wie hoch ist die Wahrscheinlichkeit, dass eine bestimmte Lieferung von B vor einer Lieferung von A erfolgt?

Was ist Ihre Antwort und warum?

Antworten:


11

Es ist 1/8. Siehe die folgende Abbildung, die die Lieferzeit von A auf der x-Achse und die von B auf der y-Achse zeigt. Da die Lieferungen gleichmäßig verteilt sind, ist es gleich wahrscheinlich, dass alle Punkte auf dem Quadrat auftreten. B liefert vor A nur im schattierten Bereich, der 1/8 der Gesamtzahl ausmacht.

Geben Sie hier die Bildbeschreibung ein

Eine andere Möglichkeit ist, dass es eine 50% ige Chance gibt, dass A liefert, bevor B überhaupt beginnt, und eine 50% ige Chance, dass B liefert, nachdem A fertig ist, was bedeutet, dass eine 75% ige Chance besteht, dass einer oder beide dieser Ereignisse eintreten. Bei der 25% igen Chance, die beide in der überlappenden Stunde liefern, ist es eine 50: 50-Chance, die zuerst liefert.


Vielen Dank für die Antwort und insbesondere für die Grafik, und das ist die Antwort, die ich schließlich gegeben habe (mit Ihrer "anderen Art, darüber nachzudenken"). Da sich die Art und Weise, wie die Frage gestellt wurde, nur auf die von B unternommenen Fahrten bezieht, scheint es mir tatsächlich 1/4 zu sein, da von 100 von B unternommenen Fahrten 25 von ihnen in der überlappenden Stunde vor A liegen. Mit anderen Worten, warum zählt der Teil, in dem es keine Chance gab, dass B zuerst ankommen könnte, weil B keine Fahrten machte? Ich habe die Frage so gelesen, dass ich nur nach Bs Reisen gefragt habe. Aber meine Wahrscheinlichkeitsfähigkeiten sind nach Jahren der Nichtbenutzung zugegebenermaßen schwach.
JPMaverick

Die Antwort gilt, weil nach "jeder Lieferung von B" im Vergleich zu "jeder Lieferung von A" gefragt wird. Stellen Sie sich einen Fall vor, in dem A von 6 bis 10 Uhr statt von 8 bis 10 Uhr liefert. Jetzt ist es noch weniger wahrscheinlich, dass eine zufällige Lieferung von B vor einer zufälligen Lieferung von A ausgeführt wird. Wenn Sie die Lieferungen von A nicht zählen, die außerhalb der Stunden von B erfolgen, hat eine Verlängerung des Lieferfensters von A auf einen früheren Zeitpunkt keine Auswirkung.
Nuclear Wang

Perfekt, verstanden. Vielen Dank. Ich
schätze,

Ich kann das immer noch nicht loslassen, weil es mir immer noch irrelevant erscheint, dass das Fenster von A erweitert wird, wenn die Frage lautet: "Von allen Reisen von B, wie viel Prozent von ihnen fanden vor mindestens einer von A's Reisen statt". Da die Verteilung gleichmäßig ist, ändert sich die Anzahl der möglicherweise überlappenden Fahrten nicht, wenn das Zustellfenster von A erweitert wird. Es scheint, dass tatsächlich KEINE Antwort möglich ist, ohne die Zustellraten von A und B zu kennen, wenn die Fragen nur über B gestellt werden (wie es war). Tut mir leid, dass ich dicht bin, wenn ich es bin, und vollkommen verständlich, wenn es langweilig wird
JPMaverick

1
@JPMaverick, ich stimme zu, dass der genaue Wortlaut der Frage wichtig ist. Diese Antwort funktioniert, wenn sie als "eine bestimmte Lieferung von B" und "eine bestimmte Lieferung von A" formuliert ist. Wenn "eine bestimmte Lieferung von B" mit "eine Lieferung von A" verglichen wird, müssen wir wissen, wie viele Lieferungen A macht. Wenn A eine Million Lieferungen zwischen 8 und 10 ausführt, ist es äußerst unwahrscheinlich, dass eine zufällige Lieferung von B erfolgt, bevor A etwas geliefert hat. Wenn A in dieser Zeit nur 2 Lieferungen ausführt, ist es vernünftigerweise möglich, dass "eine bestimmte Lieferung von B" vor "einer" Lieferung von A (dh der ersten Lieferung von A) erfolgt.
Nuclear Wang

3

Da die Fördermengen nicht angegeben werden, läßt vermuten , A liefert Paket pro Stunde und B liefert Pakete pro Stunde. Es gibt also Lieferzeitenpaare. Das Fenster, in dem sich A und B in Lieferzeiten überlappen, hat nur Paare, von denen die Hälfte A vor B steht. Der Anteil der Paare, in denen A vor B kommt, ist also ab2ein2beinb

einb212ein2b=18.

0

Ich schlage eine andere Sichtweise vor, nur wenn Sie während des Interviews einen PC hatten.

Wir können den Prozess Rzum Beispiel mit simulieren .

Simulieren wir 1000 Werte von A und die gleichen von B, wir wissen, dass beide Uniformen sind, unabhängig.

a <- runif(1000, 8, 10) # A deliveries
b <- runif(1000, 9, 11) # B deliveries
# [1] 9.485513 8.665070 8.488481 8.840332 8.755384 9.448949 # A deliveries for example

Ok, sie sind nicht genau die Zeiten, aber es ist das gleiche.

Die Wahrscheinlichkeit ist das, was wir suchen. Wir zählen also nur die Anzahl der Paare, bei denen in unserem Code ist.P(B<A)b<ein

prob <- sum(b < a)/1000
#[1] 0.112 # almost 1/8

Wir können auch die 1000 Paare zeichnen und die Region sehen, in der B zuerst kommt.(ein,b)

plot(a, b)
polygon(c(9, 10, 10, 9),
        c(9, 9, 10, 9), density = 10, angle = 135)

Geben Sie hier die Bildbeschreibung ein

Und der probobige Wert ist der Anteil der Punkte im schattierten Bereich (kommt mir bekannt vor, oder?).

Jetzt könnten wir die Formel für den Standardfehler eines Anteils verwenden, um den Standardfehler der Simulation abzuschätzen.

se <- sqrt(prob * (1 - prob) / 1000)
#[1] 0.009972763

Und wir können ein CI erstellen (unter der Annahme einer normalen Annäherung der Stichprobenverteilung von probs).

prob - 1.96*se
#[1] 0.09245338 lower bound
prob + 1.96*se
#[1] 0.1315466 upper bound

-1

Stolperte darüber und es kam in meinen Kopf. :-)

Die Antwort scheint von der relativen Anzahl der Lieferungen abhängig zu sein, die jeder LKW in der Stunde möglicher Überschneidungen (9a-10a) ausführt - es gibt keine konstante Antwort.

Angenommen, jeder LKW liefert insgesamt 2 Lieferungen (1 pro Stunde). Sie würden jeweils 1 Lieferung zwischen 9 und 10 machen und B würde nichts von A schlagen. In diesem Fall ist die Wahrscheinlichkeit also 0.

Stellen Sie sich eine vereinfachte Version des Problems vor, bei der beide nur zwischen 9 und 10a liefern (immer noch eine gleichmäßige Verteilung). Und für den Anfang nehmen wir an, dass sie die gleiche Anzahl von Lieferungen machen, n.

  • Die erste Lieferung für B schlägt alles außer der ersten Lieferung von A (die es bindet). Mit der Wahrscheinlichkeit (der Wahrscheinlichkeit, dass wir die erste Lieferung für B sind) schlagen wir ein Ereignis mit der Wahrscheinlichkeit (der Wahrscheinlichkeit, dass wir nicht die erste Lieferung sind) von A)1nn- -1n
  • Die zweite Lieferung für B schlägt alles außer den ersten beiden Lieferungen von A. Mit der Wahrscheinlichkeit schlagen wir also ein Ereignis mit der Wahrscheinlichkeit1nn- -2n
  • usw.

Wenn wir jeden dieser Begriffe in einer Summe zusammenfassen, erhalten wir:

(1nn- -1n)+(1nn- -2n)+...+(1nn- -nn)

Oder,

ich=1nn- -ichn2

Da die Wahrscheinlichkeiten einheitlich sind und die Hälfte (abgerundet) jeweils während der Stunde der Überlappung auftritt, berücksichtigen wir jeweils nur die Hälfte der Lieferungen. Wenn und im Vergleich zur gesamten Domäne, treten diese Ereignisse nur zur Hälfte auf. Damitn'=n2

12ich=1n'n'- -ichn'2

Ich glaube, dass man für bekommt .ein=b=n1/.8

Wie gehe ich damit um, dass A und B nicht die gleiche Anzahl von Paketen liefern? Nehmen Sie zur Vereinfachung erneut an, dass alle Lieferungen zwischen 9 und 10 Uhr erfolgen.

Für jede Lieferung Sie von frühester bis spätester Zeit, anstatt jede nachfolgende weniger von LKW A wie oben zu schlagen (wobei die Anzahl der Lieferungen von LKW A und die Anzahl der Lieferungen ist gemacht von ), eliminierst du . Das heißt, Sie schlagen alle bis auf einen Bruchteil von proportional zu dem Bruchteil von Sie rausgeworfen haben. Damit,b1eineinbb1beineinb

(1bein- -1einbein)+(1bn- -2einbein)+...+(1bein- -eineinbein)

Oder,

ich=1bein- -icheinbeinb

Unter Berücksichtigung der Tatsache, dass sie sich nur die Hälfte der Zeit überlappen, lassen Sie und :ein'=ein2b'=b2

12ich=1b'ein'- -ichein'b'ein'b'


Die Frage fragt nach einer Wahrscheinlichkeit. Es ist schwierig , eine realistische Werte zu finden und für die Ihre Formeln produzieren Ergebnisse zwischen und so dass sie müssen falsch sein. Wie andere Befragte gezeigt haben, gibt es eine eindeutige Antwort. Sie ergibt sich aus der Annahme einer einheitlichen Wahrscheinlichkeitsverteilung für die Lieferzeit für jeden LKW. ein,b,n01,
whuber

-1

Es ist Null:

Wenn der B-LKW im Zeitraum von [9-11] mindestens eine Lieferung hat, erfolgt mindestens eine Lieferung nach (oder gleich) 10

und diese Lieferung erfolgt nicht vor den Lieferungen von A (die alle vor 10 liegen)

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.