Wie Methoden zum Ensemble Prediction Analytic Genauigkeit zu steigern

Computer & Software / Große Daten / Daten Wissenschaft

Wie in der realen Welt, so mit der Vielzahl von prädiktiven analytischen Modellen: Wo Einheit ist, gibt es Stärke. Mehrere Modelle können auf verschiedene Weise kombiniert werden, um Vorhersagen zu machen. Sie können dann das kombinierte Modell anwenden - so genanntes Ensemble-Modell - in der Lernphase, in der Einstufungsphase oder in beiden Phasen.

Hier ist ein Weg, um ein Ensemble-Modell zu verwenden:

Teilen Sie die Trainingsdaten in mehrere Sätze.
Lassen Sie jedes der einzelnen Modelle, die die Ensemble-Modell Prozess Teile der Daten zu machen und daraus lernen.
Lassen Sie jedes Modell aus den Daten seiner Lernergebnis erzeugen.

So weit, ist es gut. Aber um das Ensemble Modell zu erhalten eine Zukunft Klasse oder Kategorie-Label für neue Daten zu prognostizieren und eine Entscheidung zu treffen, müssen Sie die neuen Daten durch alle trainierten Models- jedes Modell zu laufen prophezeit eine Klasse-Label. Dann wird auf der Grundlage der kollektiven Klassifikation oder Vorhersage, können Sie eine Gesamt Vorhersage generieren.

Sie können das gesamte Vorhersage erzeugen, indem sie einfach einen Abstimmungsmechanismus umzusetzen, die das Endergebnis entscheidet. Eine Abstimmung Technik könnte das Label verwenden, die die Mehrheit der Modelle wie das Etikett vorhersagen, dass das Ensemble-Modell als Ergebnis produziert.

Angenommen, Sie ein Modell erstellen möchten, wird vorhersagen, ob eine eingehende E-Mail-Spam ist. Es sei angenommen, daß die Trainingsdaten aus einem Satz von E-Mails besteht, in denen einige sind Spam und andere nicht. Dann können Sie diese Datenmenge mit einer Reihe von Modellen für Trainingszwecke zu verteilen.

Dann verarbeiten die trainierten Modelle eine eingehende E-Mail. Wenn die Mehrheit der Modelle als Spam zu klassifizieren, dann ist das Ensemble-Modell gibt die E-Mail die endgültige Etikett von Spam.

Eine andere Möglichkeit, ein Ensemble-Modell zu implementieren, ist die Genauigkeit der einzelnen Modelle wiegen Sie bauen in das Ensemble Modell gegen die Richtigkeit aller anderen Modelle in der Set:

Sie weisen ein spezifisches Gewicht (Genauigkeit) für jedes Modell.
Dieses Gewicht wird von einem Daten-Set zum nächsten und von einem Business-Problem zum nächsten variieren.

Nachdem die Modelle geschult sind, können Sie Testdaten verwenden, in denen Sie die Klassifizierung jedes Datenpunktes in den Testdaten kennen.
Bewerten Sie die von jedem Modell für jeden Testfall gemacht Vorhersage.
Erhöhen Sie das Gewicht für die Modelle, die korrekt und verringern das Gewicht für die Modelle vorhergesagt, dass die Daten falsch klassifiziert.

Wie Methoden zum Ensemble Prediction Analytic Genauigkeit zu steigern

Ähnliche

Menü