Zuallererst hängt die Gesamtverfügbarkeit oder Verfügbarkeit eines Clusters davon ab, wie groß ein Teil des Clusters sein muss, um aktiv zu sein, damit der gesamte Cluster als "aktiv" betrachtet werden kann.
- Reicht eine funktionierende Maschine aus? Das würde bedeuten, dass jede einzelne Maschine bei Bedarf die volle Last aufnehmen kann.
- Müssen alle gleichzeitig aktiv sein? Das heißt, es gibt keine Redundanz.
- Oder sind vielleicht zwei von drei online ausreichend? Dies würde eine größere Arbeitsbelastung als im ersten Fall ermöglichen.
Wie Sie herausgefunden haben, sind die ersten beiden Fälle recht einfach zu berechnen. Die Wahrscheinlichkeit, dass ein einzelner Server zu einem bestimmten Zeitpunkt online ist, sei p = 0,95. Für drei Server beträgt die Wahrscheinlichkeit, dass alle gleichzeitig online sind, p 3 = 0,857375.
Im umgekehrten Fall, in dem mindestens eine Maschine zu einem bestimmten Zeitpunkt aktiv sein sollte, ist es einfacher zu berechnen, indem das Problem invertiert und die Wahrscheinlichkeiten der Offline- Maschinen untersucht werden . Die Wahrscheinlichkeit, dass eine einzelne Maschine offline ist, beträgt q = 1 - p = 0,05, und daher beträgt die Wahrscheinlichkeit, dass alle gleichzeitig außer Betrieb sind, q 3 = 0,000125, was eine Wahrscheinlichkeit von 1 - q 3 = 1 - (1 - p ) ergibt. 3 = 0,999875, dass mindestens einer aktiv ist.
Der 2 von 3 Fall ist etwas schwieriger zu berechnen. Es gibt vier mögliche Situationen, in denen mindestens zwei von drei Servern aktiv sind. 1) ABC sind aktiv, 2) AB sind aktiv, 3) AC sind aktiv, 4) BC sind aktiv. Die Wahrscheinlichkeiten für alle diese sind jeweils ppp , ppq , pqp und qpp . Da die Fälle disjunkt sind, können die Wahrscheinlichkeiten addiert werden, was insgesamt A = p 3 + 3 p 2 q = 0,992750 ergibt.
(Dies kann auf weitere Maschinen erweitert werden. Die Faktoren sind die bekannten Binomialkoeffizienten , sodass das Zählen der verschiedenen Fälle von Hand meist als Übung funktioniert.)
Natürlich sind solche Berechnungen mit einem vorgefertigten Computerprogramm viel einfacher zu handhaben ... Mindestens ein Online-Rechner finden Sie hier:
http://stattrek.com/online-calculator/binomial.aspx
Eingabe der Eingabewerte: Erfolgswahrscheinlichkeit = 0,95, Anzahl der Versuche = 3, Anzahl der Erfolge = 2, wir erhalten das Ergebnis "Kumulative Wahrscheinlichkeit: P (X ≥ 2) = 0,99275". Einige andere verwandte Werte werden ebenfalls angegeben, und das Online-Tool erleichtert das Spielen mit anderen Zahlen.
Und ja, bei alledem wird davon ausgegangen, dass die Server unabhängig voneinander ausfallen. Das heißt, a) ich habe alle Probleme, die den Cluster als Ganzes betreffen, ignoriert, b) es gibt nichts Vergleichbares, was dazu führen könnte, dass die Server ausfallen oder fast zur gleichen Zeit.