Phase 1 des CRISP-DM-Prozessmodell: Geschäftsverständnis

Das Cross-Industry Standardprozess für Data Mining

(CRISP-DM) Ist die dominierende für Data-Mining-Prozess-Framework. In der ersten Phase eines Data-Mining-Projekt, bevor Sie Daten oder Werkzeuge nähern, legen Sie fest, was Sie sind die Gründe für den Wunsch, dieses Ziel zu erreichen und definieren zu erreichen.

Die Business-Verständnis Phase umfasst vier Aufgaben (Primären Aktivitäten, von denen jedes mehrere kleinere Teile beinhalten).

Aufgabe: Identifizieren Sie Ihre Unternehmensziele

Das erste, was Sie in jedem Projekt tun müssen, ist, genau herauszufinden, was Sie erreichen wollen! Das ist weniger offensichtlich, als es klingt. Viele Data Miner haben Zeit bei der Datenanalyse investiert, nur um festzustellen, dass ihre Verwaltung in der Frage nicht besonders interessiert war, wurden sie zu untersuchen. Sie müssen mit einem klaren Verständnis beginnen von

  • Ein Problem, das Ihre Management will zu adressieren

  • Die Unternehmensziele

  • Constraints (Einschränkungen auf, was Sie tun können, die Arten von Lösungen, die verwendet werden können, wenn die Arbeit abgeschlossen sein muss, und so weiter)

  • Impact (wie das Problem und mögliche Lösungen mit dem Unternehmen passen)

Deliverables für diese Aufgabe umfassen drei Elemente (in der Regel kurze Berichte über die nur die wichtigsten Punkte konzentriert):

  • Hintergrund: Erklären Sie die Geschäftslage, die das Projekt antreibt. Dieser Artikel, wie viele andere, die folgen, beträgt nur ein paar Absätze.

  • Geschäftsziele: Definieren Sie, was Ihre Organisation will mit dem Projekt zu erreichen. Dies ist in der Regel ein breiteres Ziel als Sie, als Data Miner, unabhängig erreichen können. Zum Beispiel könnte das Geschäftsziel um 10 Prozent gegenüber dem Vorjahr zu steigern Umsatz von einem Urlaub Werbekampagne sein.

  • Wirtschaftlicher Erfolg Kriterien: Definieren Sie, wie die Ergebnisse gemessen werden. Versuchen klar definierten quantitativen Erfolgskriterien zu erhalten. Wenn Sie müssen subjektiven Kriterien verwenden (Hinweis: Begriffe wie Einblicke oder erhalten einen Griff auf implizieren subjektiven Kriterien), zumindest Vereinbarung erhalten auf genau, wer wird beurteilen, ob diese Kriterien erfüllt sind.

Aufgabe: Die Beurteilung Ihrer Situation

Dies ist, wo man mehr ins Detail über die Probleme mit Ihrer Unternehmensziele im Zusammenhang erhalten. Nun werden Sie tiefer in fact-finding gehen, eine viel fleischiger Erklärung der in der Geschäftsziele Aufgabe skizziert Probleme Aufbau aus.

Deliverables für diese Aufgabe sind fünf in detaillierte Berichte:

  • Bestandsaufnahme der Ressourcen: Eine Liste aller verfügbaren Ressourcen für das Projekt. Dazu kann auch die Menschen (nicht nur Data Miner, sondern auch diejenigen mit Fachwissen des Unternehmens Problem, Datenmanager, technische Unterstützung, und andere), Daten, Hardware und Software.

  • Voraussetzungen, Annahmen und Einschränkungen: Die Anforderungen werden einen Zeitplan für die Fertigstellung, Rechts- und Sicherheitspflichten und Anforderungen für eine akzeptable fertige Arbeit umfassen. Dies ist der Punkt, um sicherzustellen, dass Sie Zugriff auf entsprechende Daten haben werden!

  • Risiken und Eventualitäten: Identifizieren Ursachen, die Fertigstellung des Projekts verzögern könnte, und die Vorbereitungen für jeden von ihnen einen Notfallplan. Zum Beispiel, wenn ein Internet-Ausfall in Ihrem Büro ein Problem darstellen könnte, vielleicht könnten Sie Ihre Kontingenz in einem anderen Büro zu arbeiten, bis der Ausfall beendet ist.

  • Terminologie: Erstellen Sie eine Liste von Geschäftsbedingungen und Data-Mining-Begriffe, die für Ihr Projekt relevant sind, und schreiben Sie sie mit den Definitionen in einem Glossar unten (und vielleicht auch Beispiele), so dass jeder an dem Projekt beteiligt, ein gemeinsames Verständnis dieser Begriffe haben kann.

  • Kosten und Nutzen: Bereiten Sie eine Kosten-Nutzen-Analyse für das Projekt. Versuchen Sie, alle Kosten und Nutzen in Dollar angeben (Euro, Pfund, Yen, und so weiter) Bedingungen. Wenn die Vorteile deutlich die Kosten nicht überschreiten, zu stoppen und diese Analyse und Ihr Projekt überdenken.

Die Entscheidungsträger oft fühlen sich wohler Altötting Ressourcen zu Projekten, die Kosten als diejenigen reduzieren, die Einnahmen zu erhöhen wollen, so dass immer für potenzielle Kosteneinsparungen suchen, und Chancen Zustand Einsparungen zunächst in den Kosten und Nutzen Bericht.

Aufgabe: Definieren Sie Ihren Daten-Mining-Ziele

Das Erreichen der Geschäftsziele erfordert oft Aktion von vielen Menschen, nicht nur die Data Miner. So, jetzt müssen Sie Ihren kleinen Teil im Gesamtbild zu definieren. Wenn das Geschäft Ziel ist, Kundenabwanderung zu reduzieren, zum Beispiel Ihre Daten-Mining-Ziele könnte sein, Ausfallraten für verschiedene Kundensegmente zu identifizieren und entwickeln Modelle vorherzusagen, welche Kunden sind am stärksten gefährdet.

Deliverables für diese Aufgabe sind zwei Berichte:

  • Data-Mining-Ziele: Definieren Sie Data-Mining-Leistungen, wie Modelle, Berichte, Präsentationen und verarbeitet Datensätze.

  • Data-Mining-Erfolgskriterien: Definieren Sie die Data-Mining-technischen Kriterien notwendig, die Geschäftserfolgskriterien zu unterstützen. Versuchen Sie, diese in quantitativer Hinsicht (wie Modellgenauigkeit oder prädiktive Verbesserung im Vergleich zu einem bestehenden Verfahren) zu definieren. Wenn die Kriterien qualitativ sein muss, identifizieren Sie die Person, die die Bewertung vornimmt.

Aufgabe: Projektplan Producing

Nun geben Sie bei jedem Schritt, den Sie, die Data Miner, zu ergreifen beabsichtigen, bis das Projekt abgeschlossen ist und die Ergebnisse werden dargestellt und überprüft.

Deliverables für diese Aufgabe sind zwei Berichte:

  • Projektplan: Skizzieren Sie Ihren Schritt-für-Schritt-Aktionsplan für das Projekt. Erweitern Sie den Umriss mit einem Zeitplan für die Fertigstellung der einzelnen Schritte, erforderlichen Ressourcen, Eingänge (wie Daten oder einem Treffen mit einem Fachexperten) und Ausgänge (wie bereinigten Daten, ein Modell oder einen Bericht) für jeden Schritt, und Abhängigkeiten (Schritte, die nicht beginnen kann, bis dieser Schritt abgeschlossen ist). Ausdrücklich fest, dass bestimmte Schritte (zB Modellierung und Bewertung in der Regel rufen mehrere Back-und-Her-Wiederholungen) muss wiederholt werden.

  • Erste Bewertung von Werkzeugen und Techniken: Identifizieren Sie die erforderlichen Fähigkeiten für die Data-Mining-Ziele zu treffen und zu bewerten, die Tools und Ressourcen, die Sie haben. Wenn etwas fehlt, muss man sehr früh im Prozess, dass die Angelegenheit auseinandersetzen.

Menü