Was ist der Unterschied zwischen Federated und Decentralized Data Warehouse?

Ich kann keine klaren Definitionen oder Erklärungen dafür finden. Beide scheinen dezentral zu sein. Es scheint, dass in Federated DWH die Daten verteilt und nicht in ein einziges Repository integriert sind und von verteilten Quellen aus zugegriffen werden.

Während der dezentralen DWH-Implementierung werden die Daten in ein zentrales Repository integriert.

Bitte erläutern Sie den Unterschied zwischen diesen beiden Implementierungen.

data-warehouse terminology distributed-databases

— LifeH2O
quelle

Ein dezentrales Data Warehouse ist im Wesentlichen eine Sammlung von Data Warehouses, die von einzelnen Regionen oder Geschäftsbereichen verwaltet, aber zentral verfügbar gemacht werden. Diese können sich auf demselben physischen Server befinden, Berichterstellungstools freigeben oder auf andere Weise unternehmensweit verfügbar gemacht werden. Es kann auch zentralisierte Komponenten wie die Stammdatenverwaltung geben. Dies geschieht normalerweise, weil zentralisierte Data Warehouses ab einer bestimmten Unternehmensgröße unhandlich werden. Ein Data Warehouse muss auf Änderungen reagieren. Wenn es zu wenig reagiert, beginnen einzelne Abteilungen mit der Entwicklung eigener Lösungen.

Sie können dies bei Investmentbanken beobachten, bei denen die Tendenz besteht, Data Warehouses zu erstellen, um bestimmte Anforderungen zu erfüllen (z. B. eine bestimmte Regulierungsinitiative oder eine Art von Finanzberichterstattung), anstatt ein zentrales Lager für das gesamte Unternehmen aufzubauen. Ein Unternehmen von der Größe einer großen Bank ist einfach zu komplex, um die Anforderungen für eine vollständig zentralisierte EDW in angemessener Zeit zu erfüllen.

Ein Verbund-Data-Warehouse fügt eine Hauptkonsolidierungsschicht in den dezentralen Data-Warehouses hinzu. In der Regel wird hier nur ein schmaler vertikaler Teil der Daten gespeichert, da der Zweck darin besteht, wichtige Kennzahlen für die Berichterstellung auf Unternehmens- oder Gruppenebene im gesamten Unternehmen zu konsolidieren, anstatt eine allgemeine MI-Plattform für alle Abteilungen bereitzustellen. Die Abteilungen müssen ihre eigenen EDW- oder MI-Systeme erstellen, müssen jedoch die Datensätze bereitstellen, die zum Auffüllen der zentralen Konsolidierungsschicht erforderlich sind.

Diese Architektur bietet Ihnen das Beste aus beiden Welten. Das zentrale Management kann ihre Metriken im gesamten Unternehmen einsehen und die Abteilungen können MI-Lösungen arrangieren, um ihre Anforderungen zu erfüllen. Das zentrale Management muss lediglich die Datenanforderungen festlegen, die für die Analyse und den MI als Feeds von den Abteilungssystemen erforderlich sind. Wenn sie eine eingehendere Berichterstattung oder Analyse für eine bestimmte Abteilung benötigen, können diese von den Abteilungssystemen bereitgestellt werden.

In dem unten verlinkten Artikel werden föderierte Data Warehouses ausführlicher behandelt.

http://www.zentut.com/data-warehouse/federated-data-warehouse-architecture/

In diesem Artikel werden Data Warehouse-Topologien ausführlicher beschrieben.

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-1

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-2

— ConcernedOfTunbridgeWells
quelle

Sie sind also beide dezentralisiert, aber föderiert integrieren eine Teilmenge (Schlüsselmetriken) an einem Ort?

— LifeH2O

Ja. Das ist richtig. Denken Sie daran, dass diese Definitionen recht informell sind, sodass die Leute sie möglicherweise anders verwenden. Ich hatte noch nie Gelegenheit, einen der beiden Systemtypen zu erstellen, obwohl ich einmal einen Vorschlag für eine Verbundarchitektur gemacht habe und einige Websites mit Systemen gesehen habe, die durch die von mir verwendeten Definitionen als dezentral charakterisiert werden könnten.

— ConcernedOfTunbridgeWells