Wie eine Regressionslinie berechnen
In der Statistik können Sie eine Regressionslinie für zwei Variablen berechnen, wenn ihre Scatterplot ein lineares Muster zeigt und die Korrelation zwischen den Variablen ist sehr stark (zum Beispiel, r
Menu
Die Formel für die am besten passende Linie (oder Regressionsgeraden) ist y = mx + b, woher m ist die Steigung der Linie und b ist der y-abfangen. Diese Gleichung selbst ist die gleiche verwendet, um eine Linie in ALGEBRA zu finden, aber denken Sie daran, in der Statistik die Punkte liegen nicht perfekt auf einer Linie - die Linie ist ein Modell, um die sich die Daten liegen, wenn ein starkes lineares Muster existiert.
Das Steigung einer Leitung ist die Änderung in Y über die Änderung der X. Beispielsweise eine Steigung von
bedeutet, als die x-Wert steigt (bewegt sich nach rechts) um 3 Einheiten, die y-Wert bewegt sich um 10 Einheiten im Durchschnitt auf.
Das y-Schnitt ist der Wert auf der y-Achse, wo die Linie kreuzt. Beispielsweise in der Gleichung y = 2x - 6, die Linie überquert die y-Achse auf den Wert b = -6. Die Koordinaten dieses Punktes (0, -6) - wenn eine Linie überquert die y-Achse, die x-Wert ist immer 0.
Sie können sich denken, dass Sie viele, viele verschiedene Linien, um zu versuchen, um zu sehen, welche am besten passt. Glücklicherweise haben Sie eine einfachere Option (obwohl auf der Scatterplot eine Linie Anglotzen tut helfen denken Sie darüber, was Sie die Antwort erwarten würden, zu sein). Die besten passende Linie hat einen ausgeprägten Hang und y-abfangen, die mit Hilfe von Formeln berechnet werden kann (und diese Formeln sind nicht allzu schwer zu berechnen).
Um eine sehr viel Zeit sparen die am besten passende Linie zu berechnen, finden zunächst die # 147-big five, # 148- fünf zusammenfassende Statistiken, die Sie in Ihren Berechnungen benötigen:
Der Mittelwert der x Werte
Der Mittelwert der y Werte
Die Standardabweichung der x Werte (bezeichnet sx)
Die Standardabweichung der y Werte (bezeichnet sy)
Die Korrelation zwischen X und Y (bezeichnet r)
Das Finden der Steigung einer Regressionsgeraden
Die Formel für die Steigung, m, der am besten passende Linie ist
woher r ist die Korrelation zwischen X und Y, und sx und sy sind die Standardabweichungen der x-Werte und y-Werte. Sie teilen Sie einfach sydurch sx und multiplizieren Sie das Ergebnis durch r.
Man beachte, dass die Steigung der am besten passenden Linie kann eine negative Zahl sein, da die Korrelation eine negative Zahl sein kann. Eine negative Steigung zeigt an, daß die Linie abwärts fährt. wenn eine Erhöhung der Polizeibeamte beispielsweise zu einer Verringerung der Anzahl von Verbrechen in einem linearen Zusammenhang mode- wird dann die Korrelation und damit die Steigung der besten passende Linie ist in diesem Fall negativ.
Die Korrelation und die Steigung der am besten passende Linie sind nicht das gleiche. Die Formel für die Steigung nimmt die Korrelation (eine einheitslose Messung) und legt Einheiten zu. Denk an sy geteilt durch sx wie die Variation (ähnlich ändern) in Y über die Variation X, in Einheiten von X und Y. Beispielsweise Änderung der Temperatur (in Grad Fahrenheit) über der Variation in der Anzahl der Grille zirpt (in 15 Sekunden).
Das Finden der y-Achsenabschnitt einer Regressionsgeraden
Die Formel für die y-abfangen, b, der am besten passende Linie ist
sind die Mittel der x-Werte und y-Werte sind, und m ist die Steigung.
So berechnen die y-abfangen, b, der am besten passende Linie, starten Sie durch den Hang zu finden, m, unter Verwendung der oben genannten Schritte des am besten passenden Linie. Dann finden die y-abfangen, multiplizieren Sie m durch
Immer berechnen die Steigung vor dem y-abfangen. Die Formel für die y-abfangen enthält die Piste!