Ich habe die Redshift-Datenbank von Amazon als möglichen zukünftigen Ersatz für unser Data Warehouse untersucht. Meine Erfahrung war immer in der Verwendung von Dimensionsmodellierung und Ralph Kimballs Methoden, daher war es etwas seltsam zu sehen, dass Redshift keine Funktionen wie den seriellen Datentyp für das automatische Inkrementieren von Spalten unterstützt.
Es gibt jedoch diesen aktuellen Blog-Beitrag aus dem AWS Big Data-Blog über die Optimierung von Redshift für ein Sternschema: https://blogs.aws.amazon.com/bigdata/post/Tx1WZP38ERPGK5K/Optimizing-for-Star-Schemas -und-Interleaved-Sorting-on-Amazon-Redshift
Die Frage, die ich habe, ist, was die beste Vorgehensweise zum Laden eines Sternschemas in Redshift ist. Ich kann diese Antwort in keiner Redshift-Dokumentation finden.
Ich neige dazu, meine Dateien aus S3 in Staging-Tabellen zu importieren und dann SQL zu verwenden, um Transformationen wie Suchvorgänge durchzuführen und Ersatzschlüssel zu generieren, bevor sie in die Zieltabellen eingefügt werden.
Tun andere das gerade? Gibt es ein ETL-Tool, das das Geld wert ist, um dies zu vereinfachen?