Ich habe einen Datensatz mit einer großen Anzahl von Cricket-Spielen (einige Tausend). Beim Cricket werfen "Bowler" wiederholt einen Ball auf eine Abfolge von "Schlagmännern". Der Bowler versucht, den Schlagmann "raus" zu bringen. In dieser Hinsicht ist es Krügen und Schlägern im Baseball ziemlich ähnlich.
Wenn ich den gesamten Datensatz nehmen und die Gesamtzahl der Bälle, die einen Schlagmann herausgeholt haben, durch die Gesamtzahl der geworfenen Bälle dividieren würde, könnte ich sehen, dass ich die durchschnittliche Wahrscheinlichkeit hätte, dass ein Bowler einen Schlagmann herausholt - es wird ungefähr 0,03 sein ( hoffentlich habe ich mich nicht schon geirrt?)
Was mich interessiert, ist, was ich tun kann, um die Wahrscheinlichkeit zu berechnen, mit der ein bestimmter Schlagmann beim nächsten Ball von einem bestimmten Bowler herausgeworfen wird.
Der Datensatz ist groß genug, dass jeder Bowler Tausende von Bällen vor einer Vielzahl von Schlagmännern geworfen hat. Ich glaube also, ich könnte einfach die Anzahl der Outs eines Bowlers durch die Anzahl der Bälle teilen, die er geworfen hat, um eine neue Wahrscheinlichkeit für diesen bestimmten Bowler zu berechnen, der aus dem nächsten Ball herauskommt.
Mein Problem ist, dass der Datensatz nicht groß genug ist, um zu garantieren, dass ein bestimmter Bowler eine statistisch signifikante Anzahl von Bällen bei einem bestimmten Schlagmann geworfen hat. Wenn ich also daran interessiert bin, die Wahrscheinlichkeit eines Ausfalls für einen bestimmten Bowler zu berechnen, der einem bestimmten Schlagmann gegenübersteht, denke ich nicht, dass dies nicht auf die gleiche vereinfachte Weise möglich ist.
Meine Frage ist, ob der folgende Ansatz gültig ist:
Im gesamten Datensatz beträgt die Wahrscheinlichkeit, dass ein Ball herauskommt, 0,03.
Wenn ich berechne, dass Bowler A im Durchschnitt eine Wahrscheinlichkeit von 0,06 hat (dh doppelt so wahrscheinlich wie ein durchschnittlicher Bowler),
und im Durchschnitt hatte Schlagmann B eine Wahrscheinlichkeit von 0,01 (ein Drittel so wahrscheinlich wie ein durchschnittlicher Schlagmann),
Ist es dann gültig zu sagen, dass die Wahrscheinlichkeit, dass dieser bestimmte Schlagmann auf dem nächsten Ball zu diesem bestimmten Bowler ausfällt, 0,06 * (0,01 / 0,03) = 0,02 beträgt?