Wie zu verwenden sind lineare Regressionen in Predictive Analytics

Lineare Regression ist eine statistische Methode, und findet Beziehungen zwischen zwei Variablen analysiert. In Predictive Analytics kann es eine Zukunft numerischen Wert einer Variablen zur Vorhersage verwendet werden.

Betrachten wir ein Beispiel von Daten, die zwei Variablen enthält: Daten aus der Vergangenheit aus den Ankunftszeiten des Zuges und die entsprechende Verzögerungszeit. Angenommen, Sie möchten vorherzusagen, was die Verzögerung für den nächsten Zug wäre. Wenn Sie die lineare Regression auf diese beiden Variablen gelten - die Ankunft und die Verzögerungszeiten - können Sie eine lineare Gleichung erzeugen wie

Delay = a + (b * Ankunftzeit) + d

Diese Gleichung drückt das Verhältnis zwischen Verzögerungszeit und Ankunftszeit. die Konstanten ein und b sind die Parameter des Modells. die Variable d ist der Fehlerterm (Auch bekannt als Rest) - Ein numerischer Wert, der die Diskrepanz zwischen den beiden Variablen darstellt verzögern und Ankunftszeit. Wenn der Fehler nicht gleich Null ist, zeigen an, dass dann könnte, dass es Kriterien die Variable beeinflussen verzögern.

Wenn Sie am Bahnhof sitzen, können Sie einfach die Ankunftszeit in der vorhergehenden Gleichung stecken und können Sie die zu erwartende Verzögerung berechnen, die lineare Regressionsmodell gegebenen Parametern a, b, und d.

Die lineare Regression ist (wie man sich vorstellen kann) am besten geeignet für lineare Daten. Aber es ist sehr empfindlich gegenüber Ausreißern in den Datenpunkten. Die Ausreißer in den Daten können einen erheblichen Einfluss auf das Modell haben. Es wird empfohlen, dass Sie diese Ausreißer aus dem Trainingssatz zu entfernen, wenn Sie planen, die lineare Regression für Ihre Vorhersagemodell zu verwenden.

Menü