Datenbankadministratoren data-warehouse

5

Wie kann eine Viele-zu-Viele-Beziehung in einem Data Warehouse implementiert werden?

Die vorherrschenden Topologien der Data Warehouse-Modellierung (Star, Snowflake) sind auf Eins-zu-Viele-Beziehungen ausgelegt. Die Lesbarkeit, Leistung und Struktur von Abfragen verschlechtert sich erheblich, wenn in diesen Modellierungsschemata eine Viele-zu-Viele-Beziehung besteht. Welche Möglichkeiten gibt es, um eine Viele-zu-Viele-Beziehung zwischen Dimensionen oder zwischen der Faktentabelle und einer Dimension in einem Data Warehouse zu …

25 database-design data-warehouse

3

Was sind die Argumente für die Verwendung des ELT-Prozesses gegenüber ETL?

Ich habe festgestellt, dass mein Unternehmen einen ELT-Prozess (Extract-Load-Transform) anstelle eines ETL-Prozesses (Extract-Transform-Load) verwendet. Was sind die Unterschiede zwischen den beiden Ansätzen und in welchen Situationen wäre einer "besser" als der andere? Es wäre großartig, wenn Sie einige Beispiele nennen könnten.

19 data-warehouse etl business-intelligence

3

Clustered Columnstore-Indizes und Fremdschlüssel

Diese Frage wurde von Stack Overflow migriert, da sie in Stack Exchange für Datenbankadministratoren beantwortet werden kann. Vor 5 Jahren migriert . Ich optimiere ein Data Warehouse mithilfe von Indizes. Ich bin ziemlich neu in SQL Server 2014. Microsoft beschreibt Folgendes: "Wir betrachten den Clustered-Columnstore-Index als Standard für das Speichern …

18 sql-server foreign-key data-warehouse sql-server-2014 columnstore

1

Abfragestrategien unter Verwendung von SQL Server 2016-Systemversion-Temporaltabellen für sich langsam ändernde Dimensionen

Welche Auswirkungen haben die Erstellung von Abfragen und die Leistung bei der Verwendung einer vom System versionierten temporalen Tabelle (neu in SQL Server 2016), wenn diese Funktion zum langsamen Ändern von Dimensionen in einem großen relationalen Data Warehouse verwendet wird? Angenommen, ich habe eine CustomerDimension von 100.000 Zeilen mit einer …

17 sql-server data-warehouse slowly-changing-dimension sql-server-2016 temporal-tables

2

Open Source Business Intelligence / DWH-Lösungen [geschlossen]

Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage, damit sie für Stack Exchange-Datenbankadministratoren thematisch relevant ist. Geschlossen vor 4 Jahren . Ich frage mich, dass diese Frage noch nicht gestellt wurde. Google hat für mich nur …

16 tools data-warehouse database-agnostic business-intelligence

3

Vergleichen Sie zwei ähnliche Postgres-Datenbanken auf Unterschiede

Ich lade gelegentlich öffentlich verfügbare Datensätze in Form von Postgres-dBs herunter. Diese Datensätze werden vom Repository-Host im Laufe der Zeit aktualisiert / geändert / erweitert. Gibt es einen Postgres-Befehl oder ein Tool (idealerweise FOSS), mit dem die Unterschiede zwischen einer ALTEN und einer NEUEN Postgres-Datenbank angezeigt werden können? (Es wird …

13 postgresql data-warehouse

2

Alternative zu EAV für dynamische Felder in einem Star-Schema-Data-Warehouse

Ich muss dynamische Felder und Werte in einem großen Datawarehouse für das Speichern des API-Anforderungsprotokolls unterstützen. Mein Anwendungsfall ist, dass ich alle API-Anforderungs-Abfragezeichenfolgen speichern und in der Lage sein muss, in Zukunft eine Abfrage für sie durchzuführen (es handelt sich also nicht nur um die Speicherung. Also kann ich keinen …

13 database-design data-warehouse eav star-schema redshift

2

ETL: Extrahieren aus 200 Tabellen - SSIS-Datenfluss oder benutzerdefiniertes T-SQL?

Basierend auf meiner Analyse muss ein vollständiges Dimensionsmodell für unser Data Warehouse aus über 200 Quelltabellen extrahiert werden. Einige dieser Tabellen werden als Teil eines inkrementellen Ladevorgangs extrahiert, andere als Volllast. Zu beachten ist, dass wir ungefähr 225 Quellendatenbanken haben, die alle dasselbe Schema haben. Wie ich gesehen habe, müssen …

12 sql-server sql-server-2005 ssis data-warehouse etl

1

Sollte ich die automatische Aktualisierungsstatistik in einem Data Warehousing-Szenario deaktivieren?

Ich habe 200 GB Data Warehouse in SQL Server. Ich habe bei einigen Abfragen sehr langsame Ausführungszeiten festgestellt. Zum Beispiel 12 Stunden für eine einfache deleteAbfrage mit einem inner join. Nachdem ich einige Nachforschungen mit den Ausführungsplänen angestellt habe, habe ich die Statistiken der beiden an der Abfrage beteiligten Tabellen …

12 sql-server data-warehouse statistics

2

Umgang mit Zeitzonen im Data Mart / Warehouse

Wir beginnen mit dem Entwurf der Bausteine eines Data Mart / Warehouse und müssen in der Lage sein, alle Zeitzonen zu unterstützen (unsere Kunden kommen aus der ganzen Welt). Beim Lesen von Diskussionen online (und in Büchern) scheint eine gängige Lösung darin zu bestehen, eine separate Datums- und Zeitdimension sowie …

11 sql-server-2012 data-warehouse datetime timezone

2

Ist die SQL Server-Datenkomprimierung für schreibgeschützte Datenbanken kategorisch gut?

In einigen Literaturstellen zur SQL Server-Datenkomprimierung, die ich gelesen habe, heißt es, dass sich die Schreibkosten auf das Vierfache der normalerweise erforderlichen Kosten erhöhen. Es scheint auch zu implizieren, dass dies der Hauptnachteil der Datenkomprimierung ist, was stark impliziert, dass bei einer schreibgeschützten Archivdatenbank die Leistung (mit wenigen Ausnahmen) durch …

11 sql-server sql-server-2012 data-warehouse compression

2

PostgreSQL für Transaktionen mit hohem Volumen und für Data Warehousing

Ich bin ziemlich neu in PostgreSQL. Ich habe noch nie eine große Bereitstellung damit durchgeführt. Aber ich habe gute Erfahrungen mit Unternehmenslösungen und möchte versuchen, etwas von dem anzuwenden, was ich mit PostgreSQL gelernt habe. Ich habe eine Site, die so dimensioniert ist, dass sie eine große Anzahl von Daten …

11 postgresql data-warehouse etl

1

Begrenzen Sie den Grad der Parallelität (DOP), der für jede Abfrage verfügbar ist

Unter Oracle Exadata (11gR2) haben wir eine relativ umfangreiche Datenbank. cpu_count ist 24 parallel_server_instances ist 2 parallel_threads_per_cpu ist 2 Durch Beobachtung in Oracle Enterprise Manager (OEM) haben wir festgestellt, dass die Leistung aufgrund der seriellen Ausführung von Abfragen schrecklich war. Um dies zu beheben, wurden alle Tabellen, materialisierten Ansichten und …

11 oracle data-warehouse

2

Data Warehouse-Design für die Berichterstellung anhand von Daten für viele Zeitzonen

Wir versuchen, ein Data Warehouse-Design zu optimieren, das die Berichterstellung für Daten für viele Zeitzonen unterstützt. Beispielsweise haben wir möglicherweise einen Bericht über die Aktivität eines Monats (Millionen von Zeilen), in dem die Aktivität nach Tagesstunden gruppiert angezeigt werden muss. Und natürlich muss diese Stunde des Tages die "lokale" Stunde …

10 sql-server database-design data-warehouse reporting timezone

2

100 TeraBytes Capacity Database - Ressourcen und Zeitschätzungen

Ich arbeite an einer Berechnung auf der Rückseite des Umschlags für ein 100-TB-Berichtsdatenbank-Setup. Ich suche hier die Gedanken der Experten. Vorgeschlagene Umgebung: Speicherkapazität ~ 100 TB Tabellen ~ 200, Größen von 1 GB bis 5 TB. Die mittlere Größe könnte zwischen 100 GB und 200 GB liegen ETL - Jobs …

10 oracle database-recommendation data-warehouse

Als «data-warehouse» getaggte Fragen