Predict Kunden Werte mit der Regressionsgeraden

Während eine Korrelation spricht auf die Stärke einer Beziehung zwischen zwei Variablen, und die r2 hilft, dass die Stärke der Beziehung zu erklären, was Sie tun müssen, um eine Variable zur Vorhersage von einem anderen ist eine Erweiterung der Korrelation genannt Regressionsanalyse zu verwenden. Regressionsanalyse wird als ein bekannter # 147-Zugpferd # 148- in Predictive Analytics. Die Mathematik ist nicht zu kompliziert, und die meisten Softwarepakete Regressionsanalyse unterstützen.

Die Regressionsanalyse erweitert die Idee der Scatterplot in Korrelation verwendet und fügt eine Linie, die am besten # 147-passt # 148- die Daten.

Eine der Anforderungen von Korrelationen und Regressionsanalyse ist, dass die Daten linear ist. Linear bedeutet eine Linie, die die Beziehung zwischen Variablen angemessen beschreiben kann und dann zur Vorhersage Werte verwendet werden, die in Ihrer Daten (zukünftige Kundendatenpunkte) nicht erscheinen. Wenn die Scatterplot Ihrer Daten eine Kurve bildet, oder eine Form, die eine Linie nicht gut passen, können Sie irreführende Ergebnisse erhalten.

Während es viele Wege gibt, Linien durch die Daten zu zeichnen, wird die Analyse der kleinsten Quadrate eine mathematische Weise, die den Abstand zwischen der Linie und jeder Punkt in der Punktwolke reduziert. Diese Analyse kann von Hand oder unter Verwendung von Software wie Minitab, SPSS, SAS, R oder Excel durchgeführt werden.

Die Abbildung zeigt eine der kleinsten Quadrate Regressionslinie.

bild0.jpg

Die Software gibt Ihnen die Gleichung der Regressionslinie über der Grafik:

Time = 86,57 + 4,486 Taps

Die Regressionsgleichung nimmt die allgemeine Form

image1.jpg

Hier ist eine Erklärung von jedem Teil der Gleichung:

image2.jpg

(Y-hat ausgesprochen): Dies ist der vorhergesagte Wert der abhängigen Variablen: vorhergesagte Zeit.

  • b0: genannt y-abfangen, ist dies, wo die Linie würde überqueren (oder Intercept) mit der y-Achse.

  • b1: Dies ist die Steigung der vorhergesagten Linie (wie steil es ist).

  • X: Dies stellt einen besonderen Wert der unabhängigen Variablen: Armaturen.

  • e: stellt die unvermeidlichen Fehler enthält die Vorhersage.

So in diesem Beispiel zeigt die Regressionsgleichung dass die vorhergesagte Menge an Zeit, die ein Kunde einen Kauf zu tätigen braucht, um 86,57 gleich ist (der y-intercept) und 4.486 (die Steigung) durch die Anzahl der Abgriffe multipliziert (X).

Es ist die Regressionsformel, die Sie Kunden Werte vorhersagen lässt, die in Ihren Daten nicht existieren. Es ermöglicht Ihnen, ausführen # 147-what-if # 148- Analysen auf zukünftige Kundenwerte. Dies ist das # 147-prädiktive # 148- Teil der prädiktiven Kundenanalyse.

Um zum Beispiel die Regressionsgleichung aus dem vorherigen Beispiel verwenden, können Sie vorhersagen, wie lange ein Kunde einen Kauf mit 38 Taps zu machen braucht. Sie füllen nur 38 in der Regressionsgleichung.

Zeit = 86,57 + 4,486 (38)
Time = 86,57 + 170,47 = 257,04

Ein Kunde benötigt 257 Sekunden, oder etwas länger als vier Minuten, einen Kauf zu tätigen, die 38 Hähne erfordert.

Die abhängige Variable wird bezeichnet # 147 Y # 148- und auf der y-Achse (vertikal) angezeigt. Die unabhängige Variable X bezeichnet und ist auf der horizontalen (x-Achse) dargestellt.

Statt eines Kunden Aufgabenzeit von Hähnen der Vorhersage, diese gleiche Ansatz kann verwendet werden, um andere Kundenanalysen vorherzusagen, einschließlich:

  • Kunden Einnahmen aus Werbeeinnahmen

  • Likelihood von Usability-Daten zu empfehlen

  • Anzahl der Conversions von der Website Seitenaufrufe

Menü