Lineare Regression Mit einem Ergebnis vorherzusagen

Statistische Forscher verwenden häufig eine lineare Beziehung der (durchschnittlichen) Zahlenwert zur Vorhersage von Y für einen gegebenen Wert von X mit einer geraden Linie (die so genannte Regressionsgeraden). Wenn Sie wissen, die Steigung und die y-Intercept dieser Regressionslinie, dann können Sie in einem Wert Stecker für X und Vorhersage der Durchschnittswert für Y. Mit anderen Worten: Sie vorherzusagen (im Mittel) Y von X.

Wenn Sie mindestens eine moderate Korrelation herstellen zwischen X und Y sowohl durch einen Korrelationskoeffizienten und einem Scatterplot, dann wissen Sie, sie irgendeine Art von linearen Beziehung haben.

Niemals eine Regressionsanalyse, wenn Sie bereits mindestens eine mäßig starke Korrelation zwischen den beiden Variablen gefunden. (Eine gute Faustregel ist es bei oder jenseits sollte entweder positiv oder negativ 0,50). Wenn die Daten nicht ähneln eine Linie zu beginnen, sollten Sie nicht versuchen, eine Linie zu verwenden, um die Daten zu passen und Vorhersagen zu machen ( aber die Leute versuchen immer noch).

Bevor voran die Gleichung für die Regressionslinie zu finden, müssen Sie, welche Ihrer beiden Variablen identifizieren X und welches Y. Wenn Korrelationen tun, ist die Wahl, welche variable Xund welches Y spielt keine Rolle, solange Sie für alle Daten konsistent sind. Aber wenn Schlanke Linien und Prognosen zu machen, die Wahl der X und Y macht einen Unterschied.

So wie Sie bestimmen, welche Variable ist das? Im Algemeinen, Y ist die Variable, die Sie vorhersagen wollen, und X ist die Variable, die Sie diese Vorhersage machen verwenden zu. Zum Beispiel, sagen Sie die Anzahl, wie oft eine Population von Grillen zirpen werden mit der Temperatur zu prognostizieren. In diesem Fall würden Sie die Variable machen Y die Temperatur und die Variable X die Zahl der zirpt. Daher Y kann vorhergesagt werden durch X unter Verwendung der Gleichung einer Linie, wenn ein stark genug lineare Beziehung existiert.

Statistiker nennen X-variable (Cricket zirpt in diesem Beispiel), die erklärende Variable, weil wenn X Änderungen, erzählt die Steigung Sie (oder erklärt), wie viel Y erwartet wird, in Reaktion auf ändern. deshalb, die Y Variable heißt die Antwort variabel. Andere Namen für X und Y umfassen die unabhängig und abhängig Variablen, respectively.

Im Fall von zwei numerischen Variablen können Sie mit einer Linie kommen, die es Ihnen ermöglicht, vorherzusagen, Y von X, wenn (und nur dann) die beiden folgenden Bedingungen erfüllt sind:

  • Der Scatterplot muss ein lineares Muster bilden.

  • Die Korrelation, r, ist mäßig bis stark (in der Regel über 0,50 oder -0,50).

Einige Forscher prüfe eigentlich nicht diese Bedingungen, bevor die Prognosen zu machen. Ihre Ansprüche sind nur gültig, wenn die beiden Bedingungen erfüllt sind.

Aber nehmen wir die Korrelation hoch tun Sie noch in der Scatterplot suchen müssen? Ja. In einigen Situationen haben die Daten eine etwas gebogene Form, aber die Korrelation ist noch Hochburgen in diesen Fällen die Prognosen mit einer geraden Linie zu machen ist immer noch ungültig. Vorhersagen in diesen Fällen müssen auf der Basis anderer Verfahren hergestellt werden, die eine Kurve stattdessen verwenden.

Menü