So verwenden Sie beaufsichtigte Analytics Predictive Models zu trainieren

Im beaufsichtigten Analytik, sowohl Eingangs- als auch Ausgangs bevorzugten sind ein Teil der Trainingsdaten. Die Predictive Analytics-Modell ist mit den korrekten Ergebnissen im Rahmen der Lernprozess vorgestellt. Solche überwachten Lernen übernimmt vorklassierten Beispiele: Das Ziel ist, das Modell lernen von den bisher bekannten Klassifikation zu erhalten, damit sie korrekt die nächste unbekannten Datenpunkt basierend auf dem Etikett können, was sie gelernt hat.

Wenn die Ausbildung des Modells abgeschlossen ist, wird eine mathematische Funktion, durch die Untersuchung der Trainingsdaten abgeleitet. Diese Funktion wird verwendet, um neue Datenpunkte zu kennzeichnen.

Für diese Vorgehensweise richtig zu arbeiten, die Trainingsdaten - Daten zusammen mit dem Test - sorgfältig ausgewählt werden müssen. Der gelernte Modell sollte die korrekte Bezeichnung für einen neuen Datenpunkt schnell und präzise Grundlage zur Vorhersage der Lage sein, auf den Datentyp (en) das Modell in den Trainingsdaten gesehen hat.

Betreute Analytik bieten einige deutliche Vorteile:

  • Der Analyst ist verantwortlich für den Prozess.

  • Kennzeichnung ist auf bekannten Einstufungen basieren.

  • Labeling Fehler leicht behoben werden kann.

Die Kehrseite dieser Vorteile ist eine ebenso deutliche Reihe von möglichen Nachteile:

  • Jeder Fehler in der Trainingsphase wird später verstärkt werden.

  • Die Klassifizierung des Analysten bereitgestellt wird, kann die gesamte Bevölkerung nicht ausreichend beschreiben.

  • Das Modell kann nicht in der Lage Klassen zu erkennen, die von der ursprünglichen Trainingssatz abweichen.

  • Die Annahme, dass die Cluster innerhalb der Daten nicht überlappen - und dass sie leicht getrennt werden können - möglicherweise ungültig erweisen.

Menü