Ich bin ein Neuling, der versucht, meinen Kopf um OLAP zu wickeln, und ich habe ein paar Fragen.
- Frage 1: Kann ein OLAP-Cube Mediane, Modi und Perzentile speichern?
- Frage 2: Kann eine vom Benutzer geschriebene MDX-Abfrage eine Zusammenfassung der Daten auf Zeilenebene zurückgeben? (Beispiel:% Transaktionen> 100 USD). Oder muss der Würfel-Designer dies dem Würfel hinzufügen?
- Frage 3: Bieten OLAP-Produkte jetzt Mechanismen für den Zugriff auf Daten auf Zeilenebene? Welche?
Unsere IT-Abteilung bittet um Feedback zu den Problemen, die wir mit einem bestimmten MS Analsis Services ROLAP-Cube haben. Wir haben keinen Zugriff auf die dahinter stehende relationale Datenbank und müssen Berechnungen durchführen, die derzeit nicht als Kennzahlen im Cube verfügbar sind.
Lassen Sie mich sehen, ob ich dieses Recht habe.
- Ein Würfel kann Statistiken für Anzahl, Mittelwert, Proportionen und Standardabweichungen liefern.
- Können wir eine MDX-Abfrage schreiben, um eine bestimmte Statistik in einer vom Cube-Designer bereitgestellten Kennzahl nicht zu berücksichtigen? Oder müssen sie den Cube ändern, um ihn aus den Daten auf Zeilenebene vorab zu berechnen?
- Ein Würfel kann keine Statistiken wie Mediane, Modi oder Perzentile bereitstellen, da diese Statistiken nicht richtig aggregieren.
Ich lese Leland Wilkinsons The Grammar of Graphics und in seinem Kapitel über Data Mining und OLAP, sagt er
Diese [Würfeloperationen] funktionieren gut mit Statistiken wie Zählungen, Mittelwerten, Proportionen und Standardabweichungen. Einfache Aggregationen über Unterklassen können berechnet werden, indem Summen, Quadratsummen und andere Begriffe verarbeitet werden, die in linearen Funktionen kombiniert werden, um grundlegende zusammenfassende Statistiken zu erstellen.
Sie funktionieren nicht richtig mit Statistiken wie Median, Modus und Perzentilen, da das Aggregat dieser Statistiken nicht die Statistik ihrer Aggregate ist. Der Median der Mediane ist beispielsweise nicht der Median des Aggregats.
Er fügt hinzu:
In letzter Zeit ist jedoch ein komplexeres ROLAP-Modell entstanden. Durch verschiedene Technologien ist es möglich, statistischen Algorithmen über das relationale Modell in Echtzeit Zugriff auf Rohdaten zu gewähren. Dieser Ansatz ist vielversprechender als die starren Aggregationen, die Strukturen wie Datenwürfel bieten.
In der elegantesten Form dieser Architektur können Anwendungen Remoteverbindungen anfordern, um Informationen zu ihren Datenverarbeitungsmethoden bereitzustellen und abhängig von den zurückgegebenen Informationen geeignete Maßnahmen zu ergreifen. In dieser Form kann die Komponentenarchitektur das wahre Versprechen des verteilten Rechnens erfüllen: Design und Ausführung, die unabhängig von Standort, Betriebssystem oder Sprache sind.
Das wurde um 2005 geschrieben. Ist jemandem bekannt, dass Produkte diese Methode verwenden, um Datenzugriff auf Zeilenebene zu ermöglichen?