Wie eine Korrelation zu berechnen
Kann eine Statistik Maßnahme sowohl die Stärke und Richtung einer linearen Beziehung zwischen zwei Variablen? Sicher! Statistiker nutzen die Korrelationskoeffizient die Stärke und die Richtung der linearen Beziehung zwischen zwei numerischen Variablen zu messen, X und Y. Der Korrelationskoeffizient für eine Probe von Daten wird bezeichnet durch r.
Obwohl die Straße Definition Korrelation gilt für zwei beliebige Elemente, die (wie Geschlecht und politischer Zugehörigkeit) verbunden sind, diesen Begriff Statistiker im Zusammenhang mit zwei numerischen Variablen nur verwenden. Der formale Begriff für die Korrelation ist die Korrelationskoeffizient. Viele verschiedene Korrelationsmaßnahmen wurden created- die man in diesem Fall verwendet wird, bezeichnet die Pearson Korrelationskoeffizient.
Die Formel für die Korrelation (r) ist
woher n ist die Anzahl von Paaren von Daten;
das sind die Probe mittels aller x-Werte und aller y-Werte, respectively- und sx und sy das sind die Stichproben-Standardabweichungen aller x- und y-Werte.
Sie können die folgenden Schritte aus, um die Korrelation zu berechnen, r, aus einem Datensatz:
Finden Sie den Mittelwert aller x-Werte
Finden Sie die Standardabweichung aller x-Werte (nennen wir es sx) Und die Standardabweichung aller y-Werte (nennen wir es sy).
Beispielsweise zu finden sx, würden Sie die folgende Gleichung verwenden:
Für jede der n Paare (x, y) In dem Datensatz, nehmen
Addieren Sie die n Ergebnisse aus Schritt 3.
Teilen Sie die Summe von sx # 8727- sy.
Das Ergebnis durch n - 1 ist, wobei n ist die Anzahl der (x, y) -Paare. (Es ist das gleiche wie mit 1 multipliziert wird über n - 1.)
Dies gibt Ihnen die Korrelation, r.
Zum Beispiel: Angenommen, Sie den Datensatz haben (3, 2), (3, 3) und (6, 4). Sie berechnen den Korrelationskoeffizienten r über die folgenden Schritte. (Hinweis für diese Daten, dass die x-Werte sind 3, 3, 6, und die y-Werte sind 2, 3, 4.)
Die Berechnung der Mittelwert der x- und y-Werte, erhalten Sie
Die Standardabweichungen sind sx = 1,73 und sy = 1,00.
Das n = 3 Unterschiede in Schritt 2 gefunden miteinander multipliziert werden: (3 - 4) (2 - 3) = (- 1) (- 1) = + 1- (3 - 4) (3 - 3) = (- 1) ( 0) = 0- (6-4) (4 - 3) = (2) (1) = +2.
das Hinzufügen der n = 3 Schritt 3 Ergebnisse erhalten Sie 1 + 0 + 2 = 3.
Die Division durch sx # 8727- sy gibt Ihnen 3 / (1,73 # 8727- 1,00) = 3 / 1,73 = 1,73. (Es ist nur ein Zufall, dass das Ergebnis von Schritt 5 auch 1,73 ist.)
Nun teilen die Schritt 5 Ergebnis von 3 - 1 (der 2), und Sie die Korrelation erhalten r = 0.87.