Wie eine Regressionslinie berechnen

In der Statistik können Sie eine Regressionslinie für zwei Variablen berechnen, wenn ihre Scatterplot ein lineares Muster zeigt und die Korrelation zwischen den Variablen ist sehr stark (zum Beispiel, r

= 0,98). Eine Regressionslinie ist einfach eine einzige Linie, die am besten zu den Daten passt (in Bezug auf die zu den Punkten der kleinsten Gesamt Abstand von der Linie hat). Statistiker nennen diese Technik für die Suche nach den am besten passenden Linie ein einfache lineare Regressionsanalyse der kleinsten Quadrate-Methode.

Scatterplot von Grille zirpt in Bezug auf Außentemperatur.
Scatterplot von Grille zirpt in Bezug auf Außentemperatur.

Die Formel für die am besten passende Linie (oder Regressionsgeraden) ist y = mx + b, woher m ist die Steigung der Linie und b ist der y-abfangen. Diese Gleichung selbst ist die gleiche verwendet, um eine Linie in ALGEBRA zu finden, aber denken Sie daran, in der Statistik die Punkte liegen nicht perfekt auf einer Linie - die Linie ist ein Modell, um die sich die Daten liegen, wenn ein starkes lineares Muster existiert.

  • Das Steigung einer Leitung ist die Änderung in Y über die Änderung der X. Beispielsweise eine Steigung von

    image1.png

    bedeutet, als die x-Wert steigt (bewegt sich nach rechts) um 3 Einheiten, die y-Wert bewegt sich um 10 Einheiten im Durchschnitt auf.

  • Das y-Schnitt ist der Wert auf der y-Achse, wo die Linie kreuzt. Beispielsweise in der Gleichung y = 2x - 6, die Linie überquert die y-Achse auf den Wert b = -6. Die Koordinaten dieses Punktes (0, -6) - wenn eine Linie überquert die y-Achse, die x-Wert ist immer 0.

Sie können sich denken, dass Sie viele, viele verschiedene Linien, um zu versuchen, um zu sehen, welche am besten passt. Glücklicherweise haben Sie eine einfachere Option (obwohl auf der Scatterplot eine Linie Anglotzen tut helfen denken Sie darüber, was Sie die Antwort erwarten würden, zu sein). Die besten passende Linie hat einen ausgeprägten Hang und y-abfangen, die mit Hilfe von Formeln berechnet werden kann (und diese Formeln sind nicht allzu schwer zu berechnen).

Um eine sehr viel Zeit sparen die am besten passende Linie zu berechnen, finden zunächst die # 147-big five, # 148- fünf zusammenfassende Statistiken, die Sie in Ihren Berechnungen benötigen:

  1. Der Mittelwert der x Werte

    image2.png
  2. Der Mittelwert der y Werte

    image3.png
  3. Die Standardabweichung der x Werte (bezeichnet sx)

  4. Die Standardabweichung der y Werte (bezeichnet sy)

  5. Die Korrelation zwischen X und Y (bezeichnet r)

Das Finden der Steigung einer Regressionsgeraden

Die Formel für die Steigung, m, der am besten passende Linie ist

image4.png

woher r ist die Korrelation zwischen X und Y, und sx und sy sind die Standardabweichungen der x-Werte und y-Werte. Sie teilen Sie einfach sydurch sx und multiplizieren Sie das Ergebnis durch r.

Man beachte, dass die Steigung der am besten passenden Linie kann eine negative Zahl sein, da die Korrelation eine negative Zahl sein kann. Eine negative Steigung zeigt an, daß die Linie abwärts fährt. wenn eine Erhöhung der Polizeibeamte beispielsweise zu einer Verringerung der Anzahl von Verbrechen in einem linearen Zusammenhang mode- wird dann die Korrelation und damit die Steigung der besten passende Linie ist in diesem Fall negativ.

Die Korrelation und die Steigung der am besten passende Linie sind nicht das gleiche. Die Formel für die Steigung nimmt die Korrelation (eine einheitslose Messung) und legt Einheiten zu. Denk an sy geteilt durch sx wie die Variation (ähnlich ändern) in Y über die Variation X, in Einheiten von X und Y. Beispielsweise Änderung der Temperatur (in Grad Fahrenheit) über der Variation in der Anzahl der Grille zirpt (in 15 Sekunden).

Das Finden der y-Achsenabschnitt einer Regressionsgeraden

Die Formel für die y-abfangen, b, der am besten passende Linie ist

image5.png

sind die Mittel der x-Werte und y-Werte sind, und m ist die Steigung.

So berechnen die y-abfangen, b, der am besten passende Linie, starten Sie durch den Hang zu finden, m, unter Verwendung der oben genannten Schritte des am besten passenden Linie. Dann finden die y-abfangen, multiplizieren Sie m durch

image6.png

Immer berechnen die Steigung vor dem y-abfangen. Die Formel für die y-abfangen enthält die Piste!

Menü