Wie die Kovarianz und Korrelation von Daten Proben zu messen
Wenn die Daten zu vergleichen Proben aus unterschiedlichen Populationen, zwei der beliebtesten Maßnahmen des Vereins sind Kovarianz und Korrelation. Kovarianz und Korrelation zeigen, dass Variablen eine positive Beziehung haben kann, eine negative Beziehung oder keine überhaupt Beziehung.
Eine Probe ist eine zufällig ausgewählte Auswahl von Elementen aus einer zugrunde liegenden Population.
Probe Kovarianz misst die Stärke und die Richtung der Beziehung zwischen den Elementen der beiden Proben und der Proben Korrelation wird aus der Kovarianz abgeleitet. Die Probe Kovarianz zwischen zwei Variablen X und Y, ist
Hier ist, was jedes Element in dieser Gleichung bedeutet:
sXY = Die Probe Kovarianz zwischen Variablen X und Y (Die beiden Indizes zeigen an, dass dies die Probe Kovarianz ist, nicht die Probe Standardabweichung).
n = Die Anzahl der Elemente in beiden Proben.
ich = eine Index dass eine Nummer zugewiesen jedes Probenelement, im Bereich von 1 bis n.
Xich = Ein einzelnes Element in der Probe X.
Yich = Ein einzelnes Element in der Probe Y.
Die Probe Kovarianz kann jede positive oder negative Wert.
Sie berechnen die Probenkorrelation (Auch als Probe bekannt Korrelationskoeffizient) zwischen X und Y direkt aus der Probe Kovarianz mit der folgenden Formel:
Die wichtigsten Begriffe in dieser Formel sind
rXY = Proben Korrelation zwischen X und Y
sXY = Probe Kovarianz zwischen X und Y
sX = Standardabweichung der Stichprobe von X
sY = Standardabweichung der Stichprobe von Y
Die Formel verwendet, um die Probe Korrelationskoeffizienten zu berechnen, stellt sicher, dass sein Wert zwischen -1 und 1 liegt.
Zum Beispiel: Angenommen, Sie eine Probe von Aktienrenditen aus dem Excelsior Gesellschaft nehmen und die Adirondack Gesellschaft aus den Jahren 2008 bis 2012, wie hier gezeigt:
Jahr | Excelsior Corp. Annual Return (Prozent) (X) | Adirondack Corp. Annual Return (Prozent) (Y) |
---|---|---|
2008 | 1 | 3 |
2009 | -2 | 2 |
2010 | 3 | 4 |
2011 | 0 | 6 |
2012 | 3 | 0 |
Was sind die Kovarianz und Korrelation zwischen den Aktienrenditen? Um das herauszufinden, müssen Sie zuerst den Mittelwert jeder Probe zu finden. In diesem Beispiel X stellt die Erträge zu Excelsior und Y stellt die Rückkehr zu Adirondack.
Die Probe Mittelwert X ist
Sie erhalten die Probe bedeuten, indem sie alle Elemente der Probe summiert und dann durch die Probengröße geteilt wird. In diesem Fall ergibt die Summe der Probenelemente 5 und die Probengröße ist 5. Die Aufteilung dieser Zahlen eine Probe Mittelwert von 1 gibt.
Die Probe Mittelwert Y ist
Diese Tabelle zeigt die verbleibenden Berechnungen für die Stichproben-Kovarianz:
In der Tabelle, die
Spalte stellt die Unterschiede zwischen den einzelnen Rückkehr zu Excelsior in der Probe und der Probe Zwischenzeit ähnlich, die
Spalte stellt die gleichen Berechnungen für Adirondack. Die Einträge in der
Spalte gleich dem Produkt der Einträge in den vorhergehenden zwei Spalten. Die Summe der
Spalte gibt den Zähler in der Probe Kovarianz Formel:
Der Nenner ist gleich der minus einer Stichprobengröße, die 5 - 1 = 4 (Beide Proben haben fünf Elemente, n = 5) Daher entspricht die Probe Kovarianz
Um die Probe Korrelationskoeffizienten berechnen, teilen Sie die Probe Kovarianz durch das Produkt aus der Probe Standardabweichung von X und die Probe Standardabweichung von Y:
Sie finden die Proben-Standardabweichung von X durch die Berechnung der Stichprobenvarianz von X und dann nehmen die Quadratwurzel des Ergebnisses. Die Tabelle zeigt die Berechnungen für die Stichprobenvarianz von X.
In der Tabelle, die
Spalte stellt die Unterschiede zwischen den einzelnen Rückkehr zu Excelsior in der Probe und die Probe meine- die
Spalte stellt den kariert Differenz zwischen jeder Rückkehr zu Excelsior und der Probe Mittelwert. Die Summe der
Spalte gibt den Zähler in der Stichprobenvarianz Formel. Sie teilen diese Zahl durch die minus einer Stichprobengröße (5 - 1 = 4), um die Stichprobenvarianz zu bekommen, X:
Die Probe Standardabweichung von X Wurzel von 4,5 ist das Quadrat, oder
Die Tabelle zeigt die Berechnungen für die Stichprobenvarianz von Y.
Basierend auf den Berechnungen in der Tabelle, die Stichprobenvarianz von Y gleich
Die Probe Standardabweichung von Y Wurzel 5 ist gleich dem Quadrat, oder
diese Werte in die Probenkorrelationsformel Substituieren gibt Ihnen
Das negative Ergebnis zeigt, dass es eine schwache negative Korrelation zwischen den Aktienrenditen von Excelsior und Adirondack. Wenn zwei Variablen perfekt negativ korreliert (sie immer bewegen sich in entgegengesetzte Richtungen), wird ihre Korrelation -1 sein. Wenn zwei Variablen unabhängig (Nichts miteinander zu tun), werden ihre Korrelation 0. Die Korrelation zwischen den Renditen zu Excelsior und Adirondack Lager ist ein -0,2108, was darauf hindeutet, dass die beiden Variablen zeigen eine leichte Tendenz in entgegengesetzte Richtungen zu bewegen.