Als «etl» getaggte Fragen

'Extrahieren, Transformieren und Laden': Datenladeverarbeitung, normalerweise im Kontext von Data Warehouse-Systemen.

3
Werden unter 9.1 noch regelmäßige VAKUUMANALYSEN empfohlen?
Ich benutze PostgreSQL 9.1 unter Ubuntu. Werden noch geplante VACUUM ANALYZEMaßnahmen empfohlen oder ist das automatische Absaugen ausreichend, um alle Anforderungen zu erfüllen? Wenn die Antwort "es kommt darauf an" ist, dann: Ich habe eine große Datenbank (30 GiB komprimierte Speichergröße, 200 GiB Datenverzeichnis) Ich führe ETL in die Datenbank …
38 postgresql  etl  vacuum 

4
Was ist eine skalierbare Methode zur Simulation von HASHBYTES mithilfe einer SQL CLR-Skalarfunktion?
Im Rahmen unseres ETL-Prozesses vergleichen wir Zeilen aus dem Staging mit der Berichtsdatenbank, um festzustellen, ob sich eine der Spalten seit dem letzten Laden der Daten tatsächlich geändert hat. Der Vergleich basiert auf dem eindeutigen Schlüssel der Tabelle und einer Art Hash aller anderen Spalten. Wir verwenden derzeit HASHBYTESden SHA2_256Algorithmus …


7
Gibt es Open Source / kostenlose ETLs? [geschlossen]
Ich habe Pentaho Data Integration bereits vor dem Kauf von Pentaho verwendet und nenne es so. Ich habe die letzte kostenlose Version. Ich habe kürzlich auf ihrer Website nachgesehen, ob sie eine andere Version veröffentlicht haben, nur um herauszufinden, dass mein bevorzugtes Open-Source-etl nicht mehr viel offen und nicht mehr …
26 etl 



2
ETL: Extrahieren aus 200 Tabellen - SSIS-Datenfluss oder benutzerdefiniertes T-SQL?
Basierend auf meiner Analyse muss ein vollständiges Dimensionsmodell für unser Data Warehouse aus über 200 Quelltabellen extrahiert werden. Einige dieser Tabellen werden als Teil eines inkrementellen Ladevorgangs extrahiert, andere als Volllast. Zu beachten ist, dass wir ungefähr 225 Quellendatenbanken haben, die alle dasselbe Schema haben. Wie ich gesehen habe, müssen …



6
Dimensionsmodellierung und ETL in Rotverschiebung
Ich habe die Redshift-Datenbank von Amazon als möglichen zukünftigen Ersatz für unser Data Warehouse untersucht. Meine Erfahrung war immer in der Verwendung von Dimensionsmodellierung und Ralph Kimballs Methoden, daher war es etwas seltsam zu sehen, dass Redshift keine Funktionen wie den seriellen Datentyp für das automatische Inkrementieren von Spalten unterstützt. …



3
Tablespace bei kurzlebiger Speicherung
Aus Leistungsgründen haben Sie in einigen Szenarien, z. B. bei Amazon EC2, Zugriff auf ein schnelleres und billigeres Speichergerät, das beim Neustart alle Daten verliert und daher als "kurzlebig" bezeichnet wird. Bei dieser Frage geht es darum, diese Art von Speicher in Installationen der Oracle-Datenbank zu nutzen. Was zerfällt in: …
7 oracle  etl 

1
Duplizieren einiger Zeilen eines Datenflusses in SSIS
Ich habe einen Datenfluss, um Daten von einer alten Datenbank in eine neue zu migrieren. Das alte Design hatte alle Daten und historischen Informationen (Änderungen) in einer einzigen Tabelle mit einer "Version" (inkrementierende Ganzzahl) für die Zeile gespeichert. Das neue Design verfügt über zwei Tabellen, eine für den "aktuellen" Status …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.