In den vergangenen Jahren haben sich viele Unternehmen während des schlechten Wirtschaftswachstums darauf besonnen, dass die optimale Nutzung vorhandener Ressourcen für Wettbewerbsfähigkeit und Gewinnaussichten den Ausschlag geben kann – und die IT hält eine Schlüsselstellung, wenn es darum geht, dem Unternehmen einen strategischen Vorteil zu verschaffen.
Teil 1 des Artikels lesen Sie in NEWSolutions, Ausgabe Dezember 2010. Michael Otey hat Sie hier in BI eingeführt. In diesem zweiten Teil lernen wir die Hürden einer BI-Einführung kennen.
Vorhandenes Optimal nutzen, Teil 2
Die im Data Warehouse oder dem Data Mart gespeicherten Informationen stammen meist von OLTP-Systemen (Online Transaction Processing). Diese Informationen werden dann üblicherweise mit OLAP-Technologien (Online Analytical Processing) verarbeitet. Genauere Informationen über OLAP entnehmen Sie bitte der Wikipedia. Im Grunde stellt OLAP eine Sicht auf die Daten her, die einem Würfel (Data Cube) entspricht, der aus Dimensionen und Maßen besteht. Als Dimension bezeichnet man eine beschreibende Kategorie, zum Beispiel eine geographische Lokation oder ein Produkttyp. Ein Maß ist ein quantitativer Wert, wie Verkäufe in Dollars, Lagerbestände oder Summe der Ausgaben.
Der eigentliche Cube besteht aus Zellen und die jeweilige Kombination von Angaben zur Dimension mit Angaben zum Maß beschreibt im Prinzip den Inhalt einer bestimmten Zelle. Diese Methode, Daten zu organisieren macht das Filtern der Daten leichter und nachfolgende Abfragen laufen schnell und effizient. Jetzt müssen nicht mehr Tausende von Zeilen verarbeitet werden, um zu einem spezifischen Ergebnis zu gelangen. Statt dessen ist die in jeder Zelle enthaltene Information bereits vorbereitet und der BI-Client muss nur noch auf die passende Zelle zugreifen – typischerweise nimmt diese Operation weniger als eine Sekunde in Anspruch. Allerdings gibt es auch einen Nachteil. Die Vorbereitung der Daten mit OLAP ist zwar der Schlüssel für eine hohe Abfrage-Performance bei Data Warehouse Queries, aber die Kehrseite der Medaille ist der hohe Speicherplatz-Bedarf. Tatsächlich ist es so, dass sich bei einer Zusammenstellung aller möglichen Kombinationen von Dimensionen mit Maßen eine so hohe Zahl von vorbereiteten Informationen/Antworten ergibt, dass diese ohne Weiteres die Zahl der ursprünglichen Datenzeilen übertreffen können. So steigt der erforderliche OLAP-Speicherbedarf sprunghaft an, mit der Zahl der Dimensionen und den vordefinierten Summierungen. Diesen sprunghaften Anstieg des Speicherbedarfs bezeichnet man typischerweise als Datenexplosion.
Hürden der BI-Einführung
Obwohl BI eine wichtige und rasch wachsende Technologie ist, sind viele Unternehmen noch nicht damit vertraut. Hier scheint es zwei Lager zu geben was BI betrifft. Die Unternehmen haben entweder bereits BI eingeführt und sind sehr erfahren oder sie sehen das Thema BI als etwas an, das sie künftig einführen wollen, aber bisher noch nicht in Angriff nehmen konnten. Es gibt mehrere gute Gründe, warum die Einführung von BI so schwer ist für Unternehmen, deren Daten in relationalen Technologien verankert sind. Erstens sind BI und Data Warehousing Technologien ganz anders als herkömmliche relationale Datenbank Technologien. Das betrifft sowohl die grundlegendste Datenbankstruktur als auch die einzusetzenden Tools und Technologien, die für den Aufbau einer BI-Lösung erforderlich sind.
Das Datenbank Design Konzept, das BI-Datenbanken verwenden, mit ihrem Schneeflocken Schema und den Dimensions Features unterscheidet sich ganz wesentlich von der 3NF (third normal form), um die sich Entwickler von relationalen Datenbanken bemühen. Gleichermaßen stark unterscheidet sich die MDX-Sprache (Multidimension Expression), die für die Abfrage auf Cubes verwendet wird, von standard SQL. Diese grundlegenden Unterschiede und Herangehensweisen erschweren Entwicklern mit sehr guten Fähigkeiten im Bereich der relationalen Datenbanken, den Sprung zu BI. BI mag zwar auf dem selben Server laufen, wie die relationale Datenbank, aber die erforderlichen Schlüsselkompetenzen sind ganz andere. Einige der Hürden bei der BI-Einführung fallen auch in die Bereiche Terminologie, Technologie und Tools.
Terminologie
Die erste Hürde bildet die BI-Terminologie. BI ist voller unvertrauter Begriffe, wie Cubes, Dimensionen, Maße, OLAP, MOLAP, HOLAP und KPIs (Key Performance Indicators) – um nur einige wenige zu nennen. Wir wollen uns jetzt einige der gebräuchlichsten BI-Begriffe ansehen. Da gibt es zunächst einmal MOLAP, ROLAP und HOLAP, die sich auf die Art von Speichersystem der jeweils verwendeten BI-Datenbank beziehen.
- MOLAP (Multidimensional OLAP) – Bei MOLAP werden alle Informationsaggregate abgespeichert, um den Datenzugriff zu erleichtern. MOLAP bietet schnellere Query Verarbeitung als andere Typen von BI-Datenbanken, aber es frisst auch mehr Speicherplatz, da alle nur denkbaren Kombinationen von Dimensionen und Maßen abgespeichert werden.
- ROLAP (Relational OLAP) – Die ROLAP-Form der Speicherung speichert die Informationsaggregate in relationalen Datenbank Tabellen. Dank dieser Verwendung von Tabellen zur Aggregat-Speicherung wird meist bei ROLAP weniger Speicherplatz verbraucht als bei MOLAP, aber die Performance leidet darunter.
- HOLAP (Hybrid OLAP) – Wie der Name schon andeutet, ist HOLAP eine Kreuzung zwischen MOLAP und ROLAP. Wie bei ROLAP bleiben mit HOLAP die primären Daten in der Quell-Datenbank. Wie bei MOLAP, speichert HOLAP bestimmte Informationsaggregate in einem bleibenden Datenspeicher, der von der primären relationalen Datenbank getrennt ist. Dank dieses gemischten Ansatzes, bietet HOLAP die Vorzüge sowohl von MOLAP als auch von ROLAP. Allerdings ist die Performance von HOLAP Lösungen typischerweise nicht so gut wie mit MOLAP, aber es wird nicht so viel Speicherplatz verbraucht.
- Cube – Eine Cube ist die grundlegende OLAP Datenstruktur. Sie ermöglicht einen schnellen Zugriff auf BI-Daten. Die Daten werden in Zellen gespeichert, die mittels der Dimensions- und Maß-Koordinaten angesteuert werden können. Abbildung 1 zeigt ein Beispiel für einen Cube.
o Dimensionen – Dimensionen sind eine beschreibende Kategorie, die für die Abfrage auf eine Cube verwendet werden können. Dimensionen ermöglichen die Filterung und Gruppierung von Daten in Cubes. Als Beispiele für Dimensionen können Parameter wie Zeit, Kunden, Produkte und Lokationen genannt werden. - Maße – Maße sind quantitative Werte, die abgefragt werden. Beispiele für Maße sind Parameter wie verkaufte Menge und Summe der Verkäufe.
- KPIs – Key Performance Indicators sind Maßeinheiten für erreichte Performance, die es einem Unternehmen ermöglichen, zu bestimmen, wie gut es seine Unternehmensziele erreichen konnte.
- Management dashboards – BI-Daten werden oft in Management Dashboards zusammengefasst, die in Web Anwendungen oder Collaboration Plattformen wie SharePoint Verwendung finden. Typischerweise bestehen sie aus einigen Graphiken und Charts, die aus vordefinierten BI-Abfragen generiert werden.
Natürlich können Sie in Wikipedia und anderswo im Web noch ausführlichere Definitionen dieser Begriffe finden.
Über den Autor
Michael Otey ist technischer Autor für NEWSolutions. Übersetzt und für den deutschsprachigen Markt überarbeitet von Isabella Pridat-Zapp.


