CONTURN - ANALYTICAL INTELLIGENCE GROUP <img src="img/film.gif" width=350 height=65 border=0>
Conturn Solutions Portfolio Realisation Infopool Kontakt Karriere
Realisation: Projektablauf


Potential-Analyse
Business Case
Projektablauf

Home
Sitemap
Impressum

Aufbau Data Warehouse (5/10)
 
 
Der Aufbau des Data Warehouse lässt sich in vier zeitlich aufeinander folgende Abschnitte einteilen:
 
1. Filterung: Zur Beginn der Transformation erfolgt die Extraktion der gewünschten relevanten Daten aus den operativen Datenverarbeitungs-Systemen. Hierbei wird das Datenmaterial auf syntaktische bzw. inhaltliche Defekte überprüft und bereinigt. Etwaige Mängel wie z. B. unrealistische Werte, die durch Falscheingaben durch die Benutzer erfolgen können, müssen bereinigt werden. Die Sub-Prozess-Filterung umfasst die Extraktion und Bereinigung.
 
2. Harmonisierung: Dies bezeichnet den Prozess der Abstimmung gefilterter Daten. Beispielsweise werden hier unterschiedliche Kodierungen wie für Geschlechter (m/w oder 0/1) vereinheitlicht. Datumsfelder spiegeln das Problem der Formatvereinheitlichung recht gut wieder. Wird z. B. eine Software aus dem englischsprachigen Raum eingesetzt, so werden - im Vergleich zum deutschsprachigen Raum - Tag und Monat anders dargestellt. Für die Datenbasis des Data Warehouse muss jedoch ein einheitliches Format festgelegt werden, in das alle anderen überführt werden können.
 
3. Verdichtung: Bei diesem Vorgang handelt es sich um die Aggregation gefilterter und harmonisierter Daten. Die Verdichtung zielt darauf, auf der Basis konsistenter Dimensionsdefinitionen Summenstrukturen zu erzeugen, die dann aus Gründen der Performanceoptimierung vorberechnet im Data Warehouse gehalten werden. Bei einer Verdichtung kann es sich z. B. um Tageszahlen zu Wochenzahlen, Monatszahlen usw. handeln.
 
4. Anreicherung: Diese beinhaltet die Bildung und Speicherung betriebswirtschaftlicher Kenngrößen aus gefilterten und harmonisierten Daten. Hierzu werden Berechnungen durchgeführt und die Ergebnisse der Kalkulation mit den übrigen Daten gespeichert. Bei der Anreicherung kann es sich z. B. um die Berechnung des Deckungsbeitrags handeln. Der Vorteil dieser Vorgehensweise liegt insbesondere darin, dass aufgrund der Vorberechnungen bei späteren Abfragen eine schnellere Antwortzeit erreicht wird.
 
 
Datentransformation (6/10)
 
Nach der Zusammenfügung der Daten müssen diese transformiert werden. Die notwendigen Transformationen hängen unmittelbar von dem gewählten Data Mining Instrument ab: Einige Methoden verwenden nur diskrete Merkmale (CHAID), andere nur binär kodierte (Genetische Algorithmen), wieder andere sowohl stetige, binär kodierte als auch diskrete Merkmale (Neuronale Netze).
 
 
Entwicklung (7/10)
 
Die im Data Warehouse vorhandenen Daten werden mit Hilfe des Data Mining Instruments analysiert. Die Vorgehensweise des Analyseprozesses hängt von der gewählten Methode ab, wie dieser Überblick deutlich macht:
  • Die Struktur eines Neuronalen Netzes passt sich selbstständig an die gesuchte Lösung an. Das Netz adaptiert Zusammenhänge, die zwischen vorliegenden Informationen und gesuchtem Verhalten z.B. von Kunden bestehen.
  • CHAID identifiziert zunächst das Merkmal, das den größten Einfluss auf die gesuchte Lösung hat und segmentiert die Daten nach deren Ausprägung. Anschließend werden die Segmente nach weiteren, für die Lösung entscheidenden Merkmalen untersucht und das Modell auf diese Weise verfeinert.
  • Bei der Verwendung der Linearen Regression wird jedes einzelne Merkmal hinsichtlich seiner Auswirkungen auf den zu prognostizierenden Sachverhalt untersucht und in einer linearen Zuordnungsvorschrift zusammengefasst.
  • Wendet man Kohonen Netze an, werden Kunden in Cluster (Zielgruppen) eingeteilt. Diese lassen sich in einem weiteren Schritt hinsichtlich ihrer Cluster-spezifischen Verhaltensweisen untersuchen.