Wie die Kovarianz und Korrelation von Daten Proben zu messen

Wenn die Daten zu vergleichen Proben aus unterschiedlichen Populationen, zwei der beliebtesten Maßnahmen des Vereins sind Kovarianz und Korrelation. Kovarianz und Korrelation zeigen, dass Variablen eine positive Beziehung haben kann, eine negative Beziehung oder keine überhaupt Beziehung.

Eine Probe ist eine zufällig ausgewählte Auswahl von Elementen aus einer zugrunde liegenden Population.

Probe Kovarianz misst die Stärke und die Richtung der Beziehung zwischen den Elementen der beiden Proben und der Proben Korrelation wird aus der Kovarianz abgeleitet. Die Probe Kovarianz zwischen zwei Variablen X und Y, ist

image0.png

Hier ist, was jedes Element in dieser Gleichung bedeutet:

  • sXY = Die Probe Kovarianz zwischen Variablen X und Y (Die beiden Indizes zeigen an, dass dies die Probe Kovarianz ist, nicht die Probe Standardabweichung).

    image1.png
  • n = Die Anzahl der Elemente in beiden Proben.

  • ich = eine Index dass eine Nummer zugewiesen jedes Probenelement, im Bereich von 1 bis n.

  • Xich = Ein einzelnes Element in der Probe X.

  • Yich = Ein einzelnes Element in der Probe Y.

    image2.png

Die Probe Kovarianz kann jede positive oder negative Wert.

Sie berechnen die Probenkorrelation (Auch als Probe bekannt Korrelationskoeffizient) zwischen X und Y direkt aus der Probe Kovarianz mit der folgenden Formel:

image3.png

Die wichtigsten Begriffe in dieser Formel sind

  • rXY = Proben Korrelation zwischen X und Y

  • sXY = Probe Kovarianz zwischen X und Y

  • sX = Standardabweichung der Stichprobe von X

  • sY = Standardabweichung der Stichprobe von Y

Die Formel verwendet, um die Probe Korrelationskoeffizienten zu berechnen, stellt sicher, dass sein Wert zwischen -1 und 1 liegt.

Zum Beispiel: Angenommen, Sie eine Probe von Aktienrenditen aus dem Excelsior Gesellschaft nehmen und die Adirondack Gesellschaft aus den Jahren 2008 bis 2012, wie hier gezeigt:

JahrExcelsior Corp. Annual Return (Prozent) (X)Adirondack Corp. Annual Return (Prozent) (Y)
200813
2009-22
201034
201106
201230

Was sind die Kovarianz und Korrelation zwischen den Aktienrenditen? Um das herauszufinden, müssen Sie zuerst den Mittelwert jeder Probe zu finden. In diesem Beispiel X stellt die Erträge zu Excelsior und Y stellt die Rückkehr zu Adirondack.

  • Die Probe Mittelwert X ist

    image4.png

Sie erhalten die Probe bedeuten, indem sie alle Elemente der Probe summiert und dann durch die Probengröße geteilt wird. In diesem Fall ergibt die Summe der Probenelemente 5 und die Probengröße ist 5. Die Aufteilung dieser Zahlen eine Probe Mittelwert von 1 gibt.

  • Die Probe Mittelwert Y ist

    image5.png

Diese Tabelle zeigt die verbleibenden Berechnungen für die Stichproben-Kovarianz:

image6.png

In der Tabelle, die

image7.png

Spalte stellt die Unterschiede zwischen den einzelnen Rückkehr zu Excelsior in der Probe und der Probe Zwischenzeit ähnlich, die

image8.png

Spalte stellt die gleichen Berechnungen für Adirondack. Die Einträge in der

image9.png

Spalte gleich dem Produkt der Einträge in den vorhergehenden zwei Spalten. Die Summe der

image10.png

Spalte gibt den Zähler in der Probe Kovarianz Formel:

image11.png

Der Nenner ist gleich der minus einer Stichprobengröße, die 5 - 1 = 4 (Beide Proben haben fünf Elemente, n = 5) Daher entspricht die Probe Kovarianz

image12.png

Um die Probe Korrelationskoeffizienten berechnen, teilen Sie die Probe Kovarianz durch das Produkt aus der Probe Standardabweichung von X und die Probe Standardabweichung von Y:

image13.png

Sie finden die Proben-Standardabweichung von X durch die Berechnung der Stichprobenvarianz von X und dann nehmen die Quadratwurzel des Ergebnisses. Die Tabelle zeigt die Berechnungen für die Stichprobenvarianz von X.

image14.png

In der Tabelle, die

image15.png

Spalte stellt die Unterschiede zwischen den einzelnen Rückkehr zu Excelsior in der Probe und die Probe meine- die

image16.png

Spalte stellt den kariert Differenz zwischen jeder Rückkehr zu Excelsior und der Probe Mittelwert. Die Summe der

image17.png

Spalte gibt den Zähler in der Stichprobenvarianz Formel. Sie teilen diese Zahl durch die minus einer Stichprobengröße (5 - 1 = 4), um die Stichprobenvarianz zu bekommen, X:

image18.png

Die Probe Standardabweichung von X Wurzel von 4,5 ist das Quadrat, oder

image19.png

Die Tabelle zeigt die Berechnungen für die Stichprobenvarianz von Y.

image20.png

Basierend auf den Berechnungen in der Tabelle, die Stichprobenvarianz von Y gleich

image21.png

Die Probe Standardabweichung von Y Wurzel 5 ist gleich dem Quadrat, oder

image22.png

diese Werte in die Probenkorrelationsformel Substituieren gibt Ihnen

image23.png

Das negative Ergebnis zeigt, dass es eine schwache negative Korrelation zwischen den Aktienrenditen von Excelsior und Adirondack. Wenn zwei Variablen perfekt negativ korreliert (sie immer bewegen sich in entgegengesetzte Richtungen), wird ihre Korrelation -1 sein. Wenn zwei Variablen unabhängig (Nichts miteinander zu tun), werden ihre Korrelation 0. Die Korrelation zwischen den Renditen zu Excelsior und Adirondack Lager ist ein -0,2108, was darauf hindeutet, dass die beiden Variablen zeigen eine leichte Tendenz in entgegengesetzte Richtungen zu bewegen.

Menü