Wie eine Korrelation zu berechnen

Bildung & Sprachen / Mathe / Statistiken

Kann eine Statistik Maßnahme sowohl die Stärke und Richtung einer linearen Beziehung zwischen zwei Variablen? Sicher! Statistiker nutzen die Korrelationskoeffizient die Stärke und die Richtung der linearen Beziehung zwischen zwei numerischen Variablen zu messen, X und Y. Der Korrelationskoeffizient für eine Probe von Daten wird bezeichnet durch r.

Obwohl die Straße Definition Korrelation gilt für zwei beliebige Elemente, die (wie Geschlecht und politischer Zugehörigkeit) verbunden sind, diesen Begriff Statistiker im Zusammenhang mit zwei numerischen Variablen nur verwenden. Der formale Begriff für die Korrelation ist die Korrelationskoeffizient. Viele verschiedene Korrelationsmaßnahmen wurden created- die man in diesem Fall verwendet wird, bezeichnet die Pearson Korrelationskoeffizient.

Die Formel für die Korrelation (r) ist

woher n ist die Anzahl von Paaren von Daten;

das sind die Probe mittels aller x-Werte und aller y-Werte, respectively- und s_x und s_y das sind die Stichproben-Standardabweichungen aller x- und y-Werte.

Sie können die folgenden Schritte aus, um die Korrelation zu berechnen, r, aus einem Datensatz:

Finden Sie den Mittelwert aller x-Werte
Finden Sie die Standardabweichung aller x-Werte (nennen wir es s_x) Und die Standardabweichung aller y-Werte (nennen wir es s_y).
Beispielsweise zu finden s_x, würden Sie die folgende Gleichung verwenden:
Für jede der n Paare (x, y) In dem Datensatz, nehmen
Addieren Sie die n Ergebnisse aus Schritt 3.

Teilen Sie die Summe von s_x # 8727- s_y.
Das Ergebnis durch n - 1 ist, wobei n ist die Anzahl der (x, y) -Paare. (Es ist das gleiche wie mit 1 multipliziert wird über n - 1.)
Dies gibt Ihnen die Korrelation, r.

Zum Beispiel: Angenommen, Sie den Datensatz haben (3, 2), (3, 3) und (6, 4). Sie berechnen den Korrelationskoeffizienten r über die folgenden Schritte. (Hinweis für diese Daten, dass die x-Werte sind 3, 3, 6, und die y-Werte sind 2, 3, 4.)

Die Berechnung der Mittelwert der x- und y-Werte, erhalten Sie
Die Standardabweichungen sind s_x = 1,73 und s_y = 1,00.

Das n = 3 Unterschiede in Schritt 2 gefunden miteinander multipliziert werden: (3 - 4) (2 - 3) = (- 1) (- 1) = + 1- (3 - 4) (3 - 3) = (- 1) ( 0) = 0- (6-4) (4 - 3) = (2) (1) = +2.
das Hinzufügen der n = 3 Schritt 3 Ergebnisse erhalten Sie 1 + 0 + 2 = 3.
Die Division durch s_x # 8727- s_y gibt Ihnen 3 / (1,73 # 8727- 1,00) = 3 / 1,73 = 1,73. (Es ist nur ein Zufall, dass das Ergebnis von Schritt 5 auch 1,73 ist.)
Nun teilen die Schritt 5 Ergebnis von 3 - 1 (der 2), und Sie die Korrelation erhalten r = 0.87.

Wie eine Korrelation zu berechnen

Ähnliche

Menü