Wie eine Korrelation zu berechnen

Kann eine Statistik Maßnahme sowohl die Stärke und Richtung einer linearen Beziehung zwischen zwei Variablen? Sicher! Statistiker nutzen die Korrelationskoeffizient die Stärke und die Richtung der linearen Beziehung zwischen zwei numerischen Variablen zu messen, X und Y. Der Korrelationskoeffizient für eine Probe von Daten wird bezeichnet durch r.

Obwohl die Straße Definition Korrelation gilt für zwei beliebige Elemente, die (wie Geschlecht und politischer Zugehörigkeit) verbunden sind, diesen Begriff Statistiker im Zusammenhang mit zwei numerischen Variablen nur verwenden. Der formale Begriff für die Korrelation ist die Korrelationskoeffizient. Viele verschiedene Korrelationsmaßnahmen wurden created- die man in diesem Fall verwendet wird, bezeichnet die Pearson Korrelationskoeffizient.

Die Formel für die Korrelation (r) ist

image0.png

woher n ist die Anzahl von Paaren von Daten;

image1.png

das sind die Probe mittels aller x-Werte und aller y-Werte, respectively- und sx und sy das sind die Stichproben-Standardabweichungen aller x- und y-Werte.

Sie können die folgenden Schritte aus, um die Korrelation zu berechnen, r, aus einem Datensatz:

  1. Finden Sie den Mittelwert aller x-Werte

    image2.png
  2. Finden Sie die Standardabweichung aller x-Werte (nennen wir es sx) Und die Standardabweichung aller y-Werte (nennen wir es sy).

    Beispielsweise zu finden sx, würden Sie die folgende Gleichung verwenden:

    image3.png
  3. Für jede der n Paare (x, y) In dem Datensatz, nehmen

    image4.png
  4. Addieren Sie die n Ergebnisse aus Schritt 3.

  5. Teilen Sie die Summe von sx # 8727- sy.

  6. Das Ergebnis durch n - 1 ist, wobei n ist die Anzahl der (x, y) -Paare. (Es ist das gleiche wie mit 1 multipliziert wird über n - 1.)

    Dies gibt Ihnen die Korrelation, r.

Zum Beispiel: Angenommen, Sie den Datensatz haben (3, 2), (3, 3) und (6, 4). Sie berechnen den Korrelationskoeffizienten r über die folgenden Schritte. (Hinweis für diese Daten, dass die x-Werte sind 3, 3, 6, und die y-Werte sind 2, 3, 4.)

  1. Die Berechnung der Mittelwert der x- und y-Werte, erhalten Sie

    image5.png
  2. Die Standardabweichungen sind sx = 1,73 und sy = 1,00.

  3. Das n = 3 Unterschiede in Schritt 2 gefunden miteinander multipliziert werden: (3 - 4) (2 - 3) = (- 1) (- 1) = + 1- (3 - 4) (3 - 3) = (- 1) ( 0) = 0- (6-4) (4 - 3) = (2) (1) = +2.

  4. das Hinzufügen der n = 3 Schritt 3 Ergebnisse erhalten Sie 1 + 0 + 2 = 3.

  5. Die Division durch sx # 8727- sy gibt Ihnen 3 / (1,73 # 8727- 1,00) = 3 / 1,73 = 1,73. (Es ist nur ein Zufall, dass das Ergebnis von Schritt 5 auch 1,73 ist.)

  6. Nun teilen die Schritt 5 Ergebnis von 3 - 1 (der 2), und Sie die Korrelation erhalten r = 0.87.

Menü