Data Mining Prozess
Der Data Mining-Prozess wird heute in erster Linie von Unternehmen mit einer starken Kunden- und Verbraucherorientierung verwendet.Der Data Mining Prozess ermöglicht die Sicht auf „interne“ Faktoren, wie Preis, Produktpositionierung, oder die Fertigkeiten des Personals und „externe“ Faktoren wie Wirtschaftsindikatoren, Wettbewerb und Kundenstruktur.
Data Mining Prozess im Detail
Der Prozess des Data Minings wird in folgende Teilschritte untergliedert: Fokussieren, Vorverarbeitung, Transformation, Data Mining und Evaluation.
- Fokussieren: Das Fokussieren zielt auf die Datenerhebung und Selektion ab
- Vorverarbeitung: In der Vorverarbeitung werden die Daten bereinigt, dabei werden die Datenquellen konsolidiert und Inkonsistenzen beseitigt
- Transformation: In der Transformation werden die Daten in das passende Format für den Analyseschritt konvertiert
- Data-Mining: Im Data Mining werden verschiedene Methoden angewendet, um den eigentlichen Analyseschritt durchführen zu können
- Evaluation: In der Evaluation werden die gefundenen Muster durch Experten ausgewertet und interpretiert
Durch den iterativen Data Mining Prozess können bereits gefundene Datenmuster in einem erneuten Durchlauf wieder verwendet und weitere oder genauere Ergebnisse erzielt werden.
Data Mining Prozess in der Praxis
Walmart ist ein Pionier bei der Verarbeitung von Informationen im Bereich Massive Data Mining. Walmart analysiert seine Lieferantenbeziehungen von über 2.900 Filialen in sechs Ländern und überträgt kontinuierlich diese Daten in ihr Data Warehouse. Die Mitarbeiter von Walmart sind so in der Lage mehr als 3.500 Lieferanten zu analysieren, um zum Beispiel bestimmte Daten über ihre Produkte abzufragen und Datenanalysen durchzuführen.
Auch im Sportbereich werden Data Mining-Anwendungen konzipiert und angewendet, um bestimmte Spielzüge oder Wahrscheinlichkeiten von Schuss- oder Wurfpositionen vorherzusagen. Dabei werden auch Faktoren wie die Spielfläche, der Spielort und die Teilnehmeranzahl in die Data Mining-Verfahren einkalkuliert. Solche Berechnungen von Wahrscheinlichkeiten helfen dem Trainer und seinen Assistenten bestimmte Spieler neu zu positionieren. Im Basketball- und Eishockey-Sport konnte man mit einigen Data Mining Prozessen interessante Korrelationen und verblüffende Ergebnisse erzielen.