Wie Testen und Testdaten für Predictive Analytics auf Gliederung

Wenn Ihre Daten bereit ist und Sie sind über den Aufbau Ihrer Vorhersagemodell für die Analyse zu beginnen, ist es nützlich, um Ihre Testmethodik zu skizzieren und einen Testplan entwerfen. Die Prüfung sollte die Geschäftsziele angesteuert werden Sie gesammelt haben, dokumentiert und alle notwendigen Daten gesammelt Sie erreichen zu helfen.

Rechts von der Fledermaus, sollten Sie eine Methode entwickeln, zu testen, ob ein Geschäftsziel erfolgreich erreicht wurde. Da Predictive Analytics die Wahrscheinlichkeit eines zukünftigen Ergebnissen messen - und der einzige Weg, bereit zu sein, einen solchen Test zu laufen durch die Ausbildung Ihr Modell auf Daten aus der Vergangenheit, haben Sie immer noch sehen, was es tun kann, wenn es gegen zukünftige Daten ist.

Natürlich können Sie nicht eine unerprobte Modell auf realen zukünftigen Daten Gefahr zu laufen, so dass Sie vorhandene Daten verwenden müssen realistisch zukünftigen Daten zu simulieren. Um dies zu tun, müssen Sie die Daten geteilt Sie gerade arbeiten in Trainings- und Testdatensätzen.

Achten Sie darauf, dass Sie diese beiden Datensätze zufällig ausgewählt, und dass beide Datensätze enthalten und decken alle Datenparameter Sie messen.

Wenn Sie Ihre Daten in Test- und Trainingsdatensätze aufgeteilt, sind zu vermeiden Sie effektiv alle Überanpassung Probleme, die anstrengendes Training das Modell auf dem gesamten Datenbestand und Kommissionierung bis alle Rauschmuster oder bestimmte Funktionen, die nur gehören zu den Beispieldatensatz auftreten können und sind nicht auf andere Datensätze.

Trennen Sie Ihre Daten in Trainings- und Testdatensätze, etwa 70 Prozent und 30 Prozent bzw. sorgt für eine genaue Messung der Leistung des Predictive Analytics-Modell sind Sie zu bauen. Sie wollen Ihr Modell gegen die Testdaten zu bewerten, weil es eine einfache Möglichkeit, ob die Vorhersagen des Modells zu messen ist genau sind.

Menü