Der Aufbau eines Predictive Analytics Modell

Eine erfolgreiche Predictive Analytics-Projekt wird schrittweise ausgeführt. Wie Sie sich in den Einzelheiten des Projekts tauchen, für diese wichtige Meilensteine ​​sehen:

  1. Definieren von Geschäftsziele

    Das Projekt beginnt mit der Verwendung einer gut definierten Unternehmensziel. Das Modell soll eine Geschäftsfrage anzusprechen. Offensichtlich dieses Ziel besagt, ermöglicht es Ihnen, den Umfang des Projekts zu definieren, und werden Sie mit der genauen Prüfung bieten ihren Erfolg zu messen.

  2. Vorbereiten von Daten

    Sie werden historische Daten verwenden, um Ihr Modell zu trainieren. Die Daten werden in der Regel über mehrere Quellen gestreut und kann die Reinigung und Vorbereitung erfordern. Die Daten können doppelte Datensätze enthalten und outliers- auf die Analyse und unter Berücksichtigung der Unternehmensziel, Sie entscheiden, ob sie zu halten oder zu entfernen. Auch könnten die Daten fehlende Werte haben, müssen möglicherweise einige Transformation zu unterziehen, und kann verwendet werden, um abgeleitete Attribute erzeugen, die mehr Aussagekraft für Ihr Ziel haben. Insgesamt zeigt die Qualität der Daten, die die Qualität des Modells.

  3. Sampling Ihre Daten

    Sie müssen Ihre Daten in zwei Gruppen aufteilen: Trainings- und Testdatensätzen. Sie bauen das Modell der Trainingsdaten verwenden. Sie verwenden die Testdaten setzen die Richtigkeit der Ausgabe des Modells zu überprüfen. so zu tun, ist absolut entscheidend. Ansonsten laufen Sie Gefahr, Überanpassung Ihr Modell - Trainieren des Modells mit einer begrenzten Datenmenge bis zu dem Punkt, dass sie alle Merkmale nimmt (sowohl das Signal und das Rauschen), die nur wahr für diesen bestimmten Datensatzes sind. Ein Modell, das für einen bestimmten Datensatz overfitted ist kläglich wird ausführen, wenn Sie es auf anderen Datensätzen ausgeführt werden. Ein Testdatensatzes sorgt für eine gültige Möglichkeit, genau das Modell die Leistung zu messen.

  4. Bau des Modells

    Manchmal bieten sich die Daten oder die Geschäftsziele zu einem bestimmten Algorithmus oder Modell. Andere Zeiten der beste Ansatz ist nicht so klar. Wie Sie die Daten untersuchen, laufen so viele Algorithmen, wie Sie ihre Ausgänge vergleichen CAN-. Basieren Ihrer Wahl des endgültigen Modells auf das Gesamtergebnis. Manchmal bist du besser dran, ein Ensemble von Modellen gleichzeitig auf die Daten ausgeführt wird und ein endgültiges Modell der Wahl mit ihren Ausgängen zu vergleichen.

  5. Bereitstellen des Modell

    Nach dem Bau des Modells, müssen Sie es, um implementieren ihre Vorteile zu nutzen. Dieser Prozess kann die Koordination mit anderen Abteilungen benötigen. Richten Sie ein einsetzbares Modell zu bauen. Auch sicher sein, Sie wissen, wie Ihre Ergebnisse an die Stakeholder in einer verständlichen und überzeugend zu präsentieren, so dass sie das Modell übernehmen. Nachdem das Modell bereitgestellt wird, müssen Sie seine Leistung zu überwachen und zu verbessern es weiter. Die meisten Modelle Zerfall nach einer gewissen Zeit. Halten Sie Ihr Modell auf dem Laufenden, indem es erfrischend mit neu verfügbaren Daten.

Menü