Wegweisende Data Miner Thomas Khabaza entwickelte seine "Neun Laws of Data Mining" neue Data-Mining zu führen, wenn sie sich an die Arbeit zu bekommen. Dieses Referenzhandbuch zeigt Ihnen, was jedes dieser Gesetze bedeutet, die Ihre tägliche Arbeit.
1. Gesetz von Data Mining oder "Geschäftsziele Law": Unternehmensziele sind der Ursprung jeder Data-Mining-Lösung.
Ein Data Miner ist jemand, der nützliche Informationen aus Daten entdeckt spezifischen Geschäftsziele zu unterstützen. Data Mining wird nicht durch das Werkzeug definiert Sie verwenden.
2. Gesetz der Data Mining oder "Business-Wissen Law": Business-Wissen ist von zentraler Bedeutung für jeden Schritt des Data Mining-Prozess.
Sie müssen kein schickes Statistiker sein Data-Mining zu tun, aber Sie haben etwas über das, was die Daten bedeutet zu wissen, und wie das Geschäft funktioniert.
3. Gesetz von Data Mining oder "Data Preparation Law": Die Datenaufbereitung ist mehr als die Hälfte aller Data-Mining-Prozess.
So ziemlich jeder Data Miner wird mehr Zeit für die Datenaufbereitung verbringen als auf Analyse.
4. Gesetz der Data Mining oder "No Free Lunch für die Data Miner": Das richtige Modell für eine gegebene Anwendung kann nur durch das Experiment entdeckt werden.
Beim Data Mining-Modelle werden durch Versuch und Irrtum ausgewählt.
5. Gesetz der Data Mining: Es gibt immer Muster in den Daten.
Als Data Miner, Sie Daten auf der Suche nach nützlichen Muster entdecken. Muster in den Daten zu verstehen können Sie beeinflussen, was in der Zukunft passiert.
6. Gesetz der Data Mining oder "Insight Law": Data Mining verstärkt Wahrnehmung im Business-Bereich.
Data-Mining-Methoden können Sie Ihr Unternehmen besser zu verstehen, als man ohne sie getan haben könnte.
7. Gesetz der Data Mining oder "Prediction Law": Prognose erhöht Informationen lokal durch Verallgemeinerung.
Data Mining hilft uns nutzen, was wir wissen, um bessere Vorhersagen (oder Schätzungen) machen von Dingen, die wir nicht kennen.
8. Gesetz von Data Mining oder "Wertgesetz": Der Wert der Data-Mining-Ergebnisse nicht durch die Genauigkeit oder Stabilität von prädiktiven Modellen bestimmt.
Ihr Modell muss eine gute Vorhersagen erzeugen, konsequent. Das ist es.
9. Gesetz der Data Mining oder "Law of Change": Alle Muster sind Änderungen vorbehalten.
Jedes Modell, das Sie große Prognosen heute gibt möglicherweise nutzlos morgen sein.
Das Cross-Industry Standardprozess für Data Mining (CRISP-DM) Ist die dominierende Data-Mining-Prozess-Framework. Es ist ein offenes Norm- jeder kann es verwenden. Die folgende Liste beschreibt die verschiedenen Phasen des Prozesses.
Identifizieren Sie Ihre Unternehmensziele
Bewerten der Situation
Definieren Sie Ihre Data Mining-Ziele
Die Herstellung Ihres Projektplans
Daten Verständnis: Überprüfen Sie die Daten, die Sie haben, zu dokumentieren, zu identifizieren Datenmanagement und Datenqualität. Aufgaben für diese Phase sind:
Daten sammeln
beschreiben
Erforschen
Überprüfen der Qualität
Datenaufbereitung: Holen Sie sich Ihre Daten bereit für die Modellierung zu verwenden. Aufgaben für diese Phase sind:
Auswählen von Daten
Bereinigen von Daten
Constructing
Die Integration von
Formatierung
Modellieren: Verwenden Sie mathematische Techniken Muster innerhalb Ihrer Daten zu identifizieren. Aufgaben für diese Phase sind:
Auswählen von Techniken
Planung Tests
Gebäudemodelle
Die Beurteilung Modelle
Auswertung: Überprüfen Sie die Muster, die Sie entdeckt haben, und zu beurteilen, ihr Potenzial für die geschäftliche Nutzung. Aufgaben für diese Phase sind:
Die Evaluierung der Ergebnisse
Die Überprüfung der Prozess
Die Bestimmung der nächsten Schritte
Einsatz: Setzen Sie Ihre Entdeckungen im täglichen Geschäft zu arbeiten. Aufgaben für diese Phase sind:
Planen der Bereitstellung (Ihre Methoden für die Integration von Data-Mining-Entdeckungen in Gebrauch)
Berichterstattung Endergebnisse
Überprüfung der Endergebnisse