Als «data-warehouse» getaggte Fragen

Ein für die Berichterstellung optimiertes Datenbanksystem, insbesondere insgesamt. Oft, aber nicht immer mit einem Sternschema implementiert.

5
Wie kann eine Viele-zu-Viele-Beziehung in einem Data Warehouse implementiert werden?
Die vorherrschenden Topologien der Data Warehouse-Modellierung (Star, Snowflake) sind auf Eins-zu-Viele-Beziehungen ausgelegt. Die Lesbarkeit, Leistung und Struktur von Abfragen verschlechtert sich erheblich, wenn in diesen Modellierungsschemata eine Viele-zu-Viele-Beziehung besteht. Welche Möglichkeiten gibt es, um eine Viele-zu-Viele-Beziehung zwischen Dimensionen oder zwischen der Faktentabelle und einer Dimension in einem Data Warehouse zu …



1
Abfragestrategien unter Verwendung von SQL Server 2016-Systemversion-Temporaltabellen für sich langsam ändernde Dimensionen
Welche Auswirkungen haben die Erstellung von Abfragen und die Leistung bei der Verwendung einer vom System versionierten temporalen Tabelle (neu in SQL Server 2016), wenn diese Funktion zum langsamen Ändern von Dimensionen in einem großen relationalen Data Warehouse verwendet wird? Angenommen, ich habe eine CustomerDimension von 100.000 Zeilen mit einer …


3
Vergleichen Sie zwei ähnliche Postgres-Datenbanken auf Unterschiede
Ich lade gelegentlich öffentlich verfügbare Datensätze in Form von Postgres-dBs herunter. Diese Datensätze werden vom Repository-Host im Laufe der Zeit aktualisiert / geändert / erweitert. Gibt es einen Postgres-Befehl oder ein Tool (idealerweise FOSS), mit dem die Unterschiede zwischen einer ALTEN und einer NEUEN Postgres-Datenbank angezeigt werden können? (Es wird …

2
Alternative zu EAV für dynamische Felder in einem Star-Schema-Data-Warehouse
Ich muss dynamische Felder und Werte in einem großen Datawarehouse für das Speichern des API-Anforderungsprotokolls unterstützen. Mein Anwendungsfall ist, dass ich alle API-Anforderungs-Abfragezeichenfolgen speichern und in der Lage sein muss, in Zukunft eine Abfrage für sie durchzuführen (es handelt sich also nicht nur um die Speicherung. Also kann ich keinen …

2
ETL: Extrahieren aus 200 Tabellen - SSIS-Datenfluss oder benutzerdefiniertes T-SQL?
Basierend auf meiner Analyse muss ein vollständiges Dimensionsmodell für unser Data Warehouse aus über 200 Quelltabellen extrahiert werden. Einige dieser Tabellen werden als Teil eines inkrementellen Ladevorgangs extrahiert, andere als Volllast. Zu beachten ist, dass wir ungefähr 225 Quellendatenbanken haben, die alle dasselbe Schema haben. Wie ich gesehen habe, müssen …

1
Sollte ich die automatische Aktualisierungsstatistik in einem Data Warehousing-Szenario deaktivieren?
Ich habe 200 GB Data Warehouse in SQL Server. Ich habe bei einigen Abfragen sehr langsame Ausführungszeiten festgestellt. Zum Beispiel 12 Stunden für eine einfache deleteAbfrage mit einem inner join. Nachdem ich einige Nachforschungen mit den Ausführungsplänen angestellt habe, habe ich die Statistiken der beiden an der Abfrage beteiligten Tabellen …


2
Ist die SQL Server-Datenkomprimierung für schreibgeschützte Datenbanken kategorisch gut?
In einigen Literaturstellen zur SQL Server-Datenkomprimierung, die ich gelesen habe, heißt es, dass sich die Schreibkosten auf das Vierfache der normalerweise erforderlichen Kosten erhöhen. Es scheint auch zu implizieren, dass dies der Hauptnachteil der Datenkomprimierung ist, was stark impliziert, dass bei einer schreibgeschützten Archivdatenbank die Leistung (mit wenigen Ausnahmen) durch …


1
Begrenzen Sie den Grad der Parallelität (DOP), der für jede Abfrage verfügbar ist
Unter Oracle Exadata (11gR2) haben wir eine relativ umfangreiche Datenbank. cpu_count ist 24 parallel_server_instances ist 2 parallel_threads_per_cpu ist 2 Durch Beobachtung in Oracle Enterprise Manager (OEM) haben wir festgestellt, dass die Leistung aufgrund der seriellen Ausführung von Abfragen schrecklich war. Um dies zu beheben, wurden alle Tabellen, materialisierten Ansichten und …

2
Data Warehouse-Design für die Berichterstellung anhand von Daten für viele Zeitzonen
Wir versuchen, ein Data Warehouse-Design zu optimieren, das die Berichterstellung für Daten für viele Zeitzonen unterstützt. Beispielsweise haben wir möglicherweise einen Bericht über die Aktivität eines Monats (Millionen von Zeilen), in dem die Aktivität nach Tagesstunden gruppiert angezeigt werden muss. Und natürlich muss diese Stunde des Tages die "lokale" Stunde …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.