Was ist der Unterschied zwischen einer Datenbank und einem Data Warehouse?


163

Was ist der Unterschied zwischen einer Datenbank und einem Data Warehouse?

Sind sie nicht dasselbe oder zumindest in demselben geschrieben (dh Oracle RDBMS)?

Antworten:


147

Schauen Sie sich diese für weitere Informationen.

Von einem vorherigen Link:

Datenbank

  1. Wird für die Online-Transaktionsverarbeitung ( OLTP ) verwendet, kann jedoch auch für andere Zwecke wie Data Warehousing verwendet werden. Dies zeichnet die Daten des Benutzers für den Verlauf auf.
  2. Die Tabellen und Verknüpfungen sind komplex, da sie normalisiert sind (für RDMS ). Dies geschieht, um redundante Daten zu reduzieren und Speicherplatz zu sparen.
  3. Entität - Relationale Modellierungstechniken werden für das RDMS-Datenbankdesign verwendet.
  4. Optimiert für den Schreibvorgang.
  5. Die Leistung von Analyseabfragen ist gering.

Data Warehouse

  1. Wird für die Online-Analyseverarbeitung ( OLAP ) verwendet. Dadurch werden die historischen Daten für die Benutzer für Geschäftsentscheidungen gelesen.
  2. Die Tabellen und Verknüpfungen sind einfach, da sie nicht normalisiert sind. Dies geschieht, um die Antwortzeit für analytische Abfragen zu verkürzen.
  3. Datenmodellierungstechniken werden für das Data Warehouse-Design verwendet.
  4. Optimiert für Lesevorgänge.
  5. Hohe Leistung für analytische Abfragen.
  6. Ist normalerweise eine Datenbank.

Es ist auch wichtig zu beachten, dass Data Warehouses von null auf viele Datenbanken bezogen werden können.


3
Datenmodellierung ist ein Oberbegriff und gilt nicht nur für Data Warehouses. (Vielleicht bedeuteten sie in der zweiten Nummer 3 "dimensionale Modellierung", da dies meiner Erfahrung nach die beliebteste Art ist, sie zu erstellen.) Die letzte Zeile macht keinen Sinn: Wie "enthält" ein Data Warehouse eine Datenbank? Ich könnte ein Daten sagen Lager ist sourced von 0 bis viele (OLTP) Datenbanken.
Patrick Marchand

2
@Mark - Wo steht, dass Datenbanken NUR für OLTP sind? Es zeigt, wie sich Datenbanken auf Data Warehouses beziehen.
TheCloudlessSky

5
@ Nickolay - Dies ist eine zwei Jahre alte Antwort. Bearbeiten Sie es und beheben Sie es, wenn Sie besorgt sind.
TheCloudlessSky

1
@DataMan - Markieren Sie dies als richtige Antwort. Es ist eine ziemlich gute und faire Antwort auf Ihre Frage.
Sanzy

1
Was ist der Unterschied zwischen Datenmodellierungstechniken und Entity-Relational-Modellierungstechniken?
QAIS

32

Aus nichttechnischer Sicht: Eine Datenbank ist auf bestimmte Anwendungen oder Anwendungen beschränkt.

Ein Data Warehouse ist ein Datenrepository auf Unternehmensebene. Es wird Daten aus allen / vielen Geschäftsbereichen enthalten. Diese Informationen werden weitergegeben, um ein globales Bild des Geschäfts zu erhalten. Es ist auch wichtig für die Integration zwischen den verschiedenen Geschäftsbereichen.

Aus technischer Sicht: Das Wort "Data Warehouse" wurde nicht anerkannt. Persönlich definiere ich ein Data Warehouse als eine Sammlung von Data Marts. Wenn jeder Datamart aus einer oder mehreren Datenbanken besteht, wobei die Datenbank für einen bestimmten Problemsatz (Anwendung, Datensatz oder Prozess) spezifisch ist.

Einfach ausgedrückt ist eine Datenbank Bestandteil eines Data-Warehouse. Es gibt viele Orte, an denen Sie dieses Konzept untersuchen können. Da es jedoch keine "Definition" gibt, werden Sie bei jeder Antwort, die Sie geben, auf Herausforderungen stoßen.


Der Datamart ist vorzugsweise eine OLTP-Datenbank?
CᴴᴀZ

@ CᴴᴀZ für was? Datamart wurde für den OLAP erstellt, Datamart ist ein kleiner DWH (für einen kleinen Teil des Geschäfts). Es wurde für die Analyse erstellt. Wenn Sie also ein OLTP-System benötigen, ist ein Datamart nicht Ihre Wahl. Wenn Sie ein Datenmodell für die Analyse benötigen (Startschema oder Schneefluss), bevorzugen Sie einen Datamart.
Enrique Benito Casado

Hey @Enrique, verstanden: Datamart trägt zum OLAP bei. Ich habe das Stichwort von Datamarts als OLTP übernommen - SQL Server OLTP Datamart .
CᴴᴀZ

Hi @ CᴴᴀZ, ich habe den Artikel gelesen und es wäre nur so, wie man ein OLTP mit einem Datamart macht. OK . (aber ich denke, sie sagten es wie eine Ausnahme) Berücksichtigen Sie, dass OLTP-Tabellen, wie sie sagen, normalisiert werden müssen, um keine Inkonsistenzen zu haben. Die Normalisierung ist in einem ER-Schema nicht so kompliziert, aber für Star-Schema oder Snow-Flow viel komplizierter. Diese Schemata erleichtern das Lesen in der Datenbank und nicht die Transaktionsoperationen. Deshalb sollte die Verwendung eines Datamarts wie OLTP keine gute Idee sein, auch wenn dies möglich ist.
Enrique Benito Casado

16

Ein Data Warehouse ist ein Datenbanktyp.

Zusätzlich zu dem, was die Leute bereits gesagt haben, handelt es sich bei Data Warehouses in der Regel um OLAP mit Indizes usw., die auf Lesen und nicht auf Schreiben abgestimmt sind, und die Daten werden de-normalisiert / in Formulare umgewandelt, die einfacher zu lesen und zu analysieren sind.

Einige Leute haben gesagt, "Datenbanken" sind die gleichen wie OLTP - das ist nicht wahr. OLTP ist wiederum ein Datenbanktyp.

Andere Arten von "Datenbanken": Textdateien, XML, Excel, CSV ..., Flat Files :-)


1
Dies ist die richtige Antwort von allen. Und ein bisschen auf Datamart:It is a logical subset of Data warehouse, generally based upon business functions.
CᴴᴀZ

7

Der einfachste Weg, dies zu erklären, wäre zu sagen, dass ein Data Warehouse aus mehr als nur einer Datenbank besteht. Eine Datenbank ist eine Sammlung von Daten, die auf irgendeine Weise organisiert sind. Ein Data Warehouse ist jedoch speziell organisiert, um "die Berichterstellung und Analyse zu erleichtern". Dies ist jedoch nicht die ganze Geschichte, da Data Warehousing auch "die Mittel zum Abrufen und Analysieren von Daten, zum Extrahieren, Transformieren und Laden von Daten sowie zum Verwalten des Datenwörterbuchs enthält, die ebenfalls als wesentliche Komponenten eines Data Warehousing-Systems angesehen werden".

Data Warehouse


4

Datenbank : - OLTP (Online-Transaktionsprozess)

  • Es handelt sich um aktuelle Daten, aktuelle detaillierte Daten, flache relationale isolierte Daten.
  • Die Entitätsbeziehung wird zum Entwerfen der Datenbank verwendet
  • DB-Größe 100 MB-GB einfache Transaktion oder Anforderungen

Datawarehouse

  • OLAP (Online-Analyseprozess)
  • Es geht um historische Daten Sternschema, schneebedecktes Schema und Galaxie
  • Das Schema wird zum Entwerfen des Data Warehouse verwendet
  • DB-Größe 100 GB-TB Verbesserte Grundlage für die Abfrageleistung für die DATA MINING-DATENVISUALISIERUNG
  • Ermöglicht Benutzern ein tieferes Verständnis und Wissen über verschiedene Aspekte ihrer Unternehmensdaten durch schnellen, konsistenten und interaktiven Zugriff auf eine Vielzahl möglicher Ansichten der Daten

4

Data Warehouse vs Database: Ein Data Warehouse wurde speziell für die Datenanalyse entwickelt. Dabei werden große Datenmengen gelesen, um die Beziehungen und Trends in den Daten zu verstehen. Eine Datenbank wird zum Erfassen und Speichern von Daten verwendet, z. B. zum Aufzeichnen von Details einer Transaktion.

Data Warehouse: Geeignete Workloads - Analyse, Berichterstellung, Big Data. Datenquelle - Daten, die aus vielen Quellen gesammelt und normalisiert wurden. Datenerfassung - Massenschreibvorgänge werden normalerweise nach einem festgelegten Stapelzeitplan ausgeführt. Datennormalisierung - Denormalisierte Schemata, z. B. das Sternschema oder das Schneeflockenschema. Datenspeicherung - Optimiert für einfachen Zugriff und schnelle Abfrage. Leistung mit Spaltenspeicher. Datenzugriff - Optimiert, um E / A zu minimieren und den Datendurchsatz zu maximieren.

Transaktionsdatenbank: Geeignete Workloads - Transaktionsverarbeitung. Datenquelle - Daten werden unverändert aus einer einzigen Quelle erfasst, z. B. aus einem Transaktionssystem. Datenerfassung - Optimiert für kontinuierliche Schreibvorgänge, da neue Daten verfügbar sind, um den Transaktionsdurchsatz zu maximieren. Datennormalisierung - Stark normalisierte statische Schemata. Datenspeicherung - Optimiert für hohe Schreibvorgänge in einem einzelnen zeilenorientierten physischen Block. Datenzugriff - Große Mengen kleiner Lesevorgänge.


1

Jeder Datenspeicher für die Anwendung verwendet im Allgemeinen die Datenbank. Es kann sich um eine relationale Datenbank oder keine SQL-Datenbanken handeln, die derzeit im Trend liegen.

Data Warehouse ist auch eine Datenbank. Wir können die Data Warehouse-Datenbank als spezialisierte Datenspeicherung für die analytischen Berichtszwecke des Unternehmens aufrufen. Diese Daten werden für wichtige Geschäftsentscheidungen verwendet.

Die organisierten Daten helfen dabei, effektiv zu berichten und Geschäftsentscheidungen zu treffen.


1

Datenbank:

Wird für die Online-Transaktionsverarbeitung (OLTP) verwendet.

  • Transaktionsorientiert.
  • Anwendungsorientiert.
  • Aktuelle Daten.
  • Detaillierte Daten.
  • Skalierbare Daten.
  • Viele Benutzer, Administratoren / Operational.
  • Ausführungszeit: kurz.

Data Warehouse:

Wird für die Online-Analyseverarbeitung (OLAP) verwendet.

  • Orientierte Analyse.
  • Fachorientiert.
  • Historische Daten.
  • Aggregierte Daten.
  • Statische Daten.
  • Nicht viele Benutzer, Manager.
  • Ausführungszeit: lang.

1

Ein Data Warehousing (DW) ist ein Prozess zum Sammeln und Verwalten von Daten aus verschiedenen Quellen, um aussagekräftige Geschäftsinformationen bereitzustellen. Ein Data Warehouse wird normalerweise verwendet, um Geschäftsdaten aus heterogenen Quellen zu verbinden und zu analysieren. Das Data Warehouse ist der Kern des BI-Systems, das für die Datenanalyse und Berichterstellung erstellt wurde.


0

Die Quelle für das Data Warehouse kann ein Cluster von Datenbanken sein, da Datenbanken für den Online-Transaktionsprozess verwendet werden, z. B. für die Aufbewahrung der aktuellen Aufzeichnungen. Im Data Warehouse werden jedoch historische Daten gespeichert, die für den Online-Analyseprozess bestimmt sind.


0

Ein Data Warehouse ist eine Art Datenstruktur, die normalerweise in einer Datenbank gespeichert ist. Das Data Warehouse bezieht sich auf das Datenmodell und darauf, welche Art von Daten dort gespeichert sind - Daten, die modelliert werden (Datenmodell), um einen analytischen Zweck zu erfüllen.

Eine Datenbank kann als jede Struktur klassifiziert werden, in der Daten gespeichert sind. Traditionell wäre das ein RDBMS wie Oracle, SQL Server oder MySQL. Eine Datenbank kann jedoch auch eine NoSQL-Datenbank wie Apache Cassandra oder ein säulenförmiger MPP wie AWS RedShift sein.

Sie sehen, eine Datenbank ist einfach ein Ort zum Speichern von Daten. Ein Data Warehouse ist eine bestimmte Methode zum Speichern von Daten und dient einem bestimmten Zweck, nämlich der Bereitstellung analytischer Abfragen.

OLTP und OLAP erkennen nicht den Unterschied zwischen einem DW und einer Datenbank. Sowohl OLTP als auch OLAP befinden sich in Datenbanken. Sie speichern Daten nur auf unterschiedliche Weise (unterschiedliche Datenmodellmethoden) und dienen unterschiedlichen Zwecken (OLTP - Aufzeichnen von Transaktionen, optimiert für Aktualisierungen; OLAP - Analysieren von Informationen, optimiert für Lesevorgänge).


-1

Siehe in einfachen Worten: Dataware -> Riesige Daten für Analytical / Storage / Copy und Analysis. Datenbank -> CRUD-Operation mit häufig verwendeten Daten.

Dataware House ist eine Art Speicher, den Sie nicht täglich verwenden. Die Datenbank ist etwas, mit dem Sie häufig zu tun haben.

Z.B. Wenn wir nach einem Kontoauszug fragen, erhalten wir ihn für die letzten 3/4/6 / weiteren Monate, da er sich in der Datenbank befindet. Wenn Sie mehr als das wollen, wird es im Dataware-Haus gespeichert.


-1

Beispiel: Ein Haus ist es wert $100,000und es wird $1000pro Jahr geschätzt .

Um den aktuellen Hauswert zu verfolgen, verwenden Sie eine Datenbank, da sich der Wert jedes Jahr ändert.

Drei Jahre später könnten Sie den Wert des Hauses sehen, das ist $103,000.

Um den historischen Hauswert zu verfolgen, würden Sie ein Data Warehouse verwenden, wie der Wert des Hauses sein sollte

$100,000 on year 0, 
$101,000 on year 1, 
$102,000 on year 2, 
$103,000 on year 3. 
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.