Cloud - Services gehostet von Amazon Web Services , Azure , Google und die meisten anderen veröffentlichen die S ervice L evel A greement oder SLA, für die einzelnen Dienstleistungen , die sie bieten. Architekten, Plattformingenieure und Entwickler sind dann dafür verantwortlich, diese zusammenzustellen, um eine Architektur zu erstellen, die das Hosting für eine Anwendung bereitstellt.
Für sich genommen bieten diese Dienste in der Regel eine Verfügbarkeit im Bereich von drei bis vier Neun:
- Azure Traffic Manager: 99,99% oder vier Neunen.
- SQL Azure: 99,99% oder vier Neunen.
- Azure App-Dienst: 99,95% oder "Drei Neun Fünf".
Wenn sie jedoch in Architekturen kombiniert werden, besteht die Möglichkeit, dass eine Komponente ausfällt, was zu einer Gesamtverfügbarkeit führt, die nicht den Komponentendiensten entspricht.
Verfügbarkeit der seriellen Verbindung
In diesem Beispiel gibt es drei mögliche Fehlermodi:
- SQL Azure ist inaktiv
- App Service ist nicht verfügbar
- Beide sind unten
Daher muss die Gesamtverfügbarkeit dieses "Systems" unter 99,95% liegen. Mein Grund zu der Annahme ist, dass die SLA für beide Dienste:
Der Service ist 23 Stunden von 24 verfügbar
Dann:
- Der App-Service kann zwischen 01:00 und 02:00 Uhr ausfallen
- Die Datenbank aus zwischen 0500 und 0600
Beide Komponenten befinden sich innerhalb ihrer SLA, aber das Gesamtsystem war für 2 von 24 Stunden nicht verfügbar.
Serielle und parallele Verfügbarkeit
In dieser Architektur gibt es jedoch hauptsächlich eine große Anzahl von Fehlermodi:
- SQL Server in RegionA ist inaktiv
- SQL Server in RegionB ist inaktiv
- App Service in RegionA ist nicht verfügbar
- App Service in RegionB ist nicht verfügbar
- Der Traffic Manager ist ausgefallen
- Kombinationen von oben
Da der Traffic Manager ein Leistungsschalter ist, kann er einen Ausfall in beiden Regionen erkennen und den Verkehr in die Arbeitsregion leiten. Es gibt jedoch immer noch einen einzelnen Ausfallpunkt in Form des Traffic Managers, sodass die Gesamtverfügbarkeit des "Systems" nicht gewährleistet ist höher als 99,99% sein.
Wie kann die Gesamtverfügbarkeit der beiden oben genannten Systeme für das Unternehmen berechnet und dokumentiert werden, was möglicherweise eine Neugestaltung erfordert, wenn das Unternehmen ein höheres Servicelevel wünscht, als die Architektur bereitstellen kann?
Wenn Sie die Diagramme mit Anmerkungen versehen möchten, habe ich sie in Lucid Chart erstellt und einen Mehrzweck-Link erstellt. Beachten Sie, dass jeder diese bearbeiten kann, sodass Sie möglicherweise eine Kopie der zu kommentierenden Seiten erstellen möchten.