Histogramme: Graphische Technik für die statistische Daten

EIN Histogramm ist ein Diagramm, das die Wahrscheinlichkeitsverteilung eines Datensatzes repräsentiert. Ein Histogramm hat eine Reihe von vertikalen Balken, wo jeder Balken einen einzelnen Wert oder einen Bereich von Werten für eine Variable darstellt. Die Höhen der Balken zeigen die Häufigkeiten oder Wahrscheinlichkeiten für die verschiedenen Werte oder Wertebereiche.

Zum Beispiel zeigt diese Figur ein Histogramm der Tagespreise von Apple-Aktie ab 1. Januar 2013 bis 31. Dezember 2013.

Histogramm der Tagespreise für Apple-Aktie.
Histogramm der Tagespreise für Apple-Aktie.

Nach diesem Histogramm waren die meisten der Preise zwischen $ 60 und $ 65- der Preis war in diesem Bereich 81 mal im Jahr. Die zweite am häufigsten beobachteten Preise lagen zwischen $ 55 und $ 60- der Preis landete in diesem Bereich 44 Mal im Laufe des Jahres. Die dritthäufigste Preisspanne lag zwischen $ 65 und $ 70 und die vierthäufigste Preisspanne lag zwischen $ 70 und $ 75. Nur sehr wenige waren die Preise zwischen $ 50 und $ 55, und die wenigsten Preise im Laufe des Jahres zu beobachten waren zwischen $ 80 und $ 85.

Basierend auf dem Graphen, waren der Mittelwert und Median Preis in der Nähe der 60 $ bis 65 $ Bereich. Der tatsächliche Mittelwert war 65,67 $, und die tatsächliche Median war $ 63,65. Da die mittlere übersteigt den Median, war die Verteilung der Preise für das Jahr 2013 positiv verzerrt. Dies zeigt an, dass die Wahrscheinlichkeit einer extrem großen Preis ist etwas größer als die Wahrscheinlichkeit eines extrem niedrigen Preis.

Eine Verteilung ist positiv verzerrt, wenn der Mittelwert größer als der median ist es negativ verzerrt ist, wenn der Mittelwert kleiner als der Median ist. Die Verteilung ist symmetrisch um den Mittelwert, wenn der Mittelwert den Mittelwert entspricht. Wie viel die Daten schief hängt davon ab, wie weit der Mittelwert und Median abweichen. Wenn sie ganz in der Nähe sind, ist es manchmal sinnvoll, die Verteilung symmetrisch zu behandeln.

Als weiteres Beispiel zeigt diese Figur ein Histogramm der täglichen Kurse des S & P 500-Aktienindex von 1. Januar 2013 bis 31. Dezember 2013.

Histogramm der Tagespreise für den S & P 500.
Histogramm der Tagespreise für die SP 500.

Nach dem Histogramm in Abbildung 12-10, die am häufigsten beobachtete Preisspanne während des Jahres war zwischen $ 1.650 und 1.700 $. Die mittlere stellte sich heraus, $ 1,643.80, und das mittlere war $ 1,650.41 zu sein. Im Gegensatz zu Apple-Aktie betrug die mittlere unten die median die Verteilung der Preise für das Jahr 2013 ist negativ verzerrt. Dies zeigt an, dass es eine etwas stärkere Tendenz für die Standard und Poors betrug 500 als im Jahr 2013 über dem Mittelwert unter dem Mittelwert für den Handel.

Eine der wichtigsten Verwendungen von Histogrammen ist, um zu bestimmen, ob ein Datensatz eine spezifizierte Wahrscheinlichkeitsverteilung folgt. Obwohl es viele formale statistische Tests sind zu bestimmen, welche Wahrscheinlichkeitsverteilung ein Datensatz folgt, dann ist es gute Praxis, um visuell die Daten mit einem Diagramm überprüfen, bevor sie in eine formelle statistische Tests eingreifen.

Das Histogramm von Apple Preise bietet starke Hinweise darauf, dass Apple-Aktienkurse nicht normal verteilt. Die Normalverteilung ist symmetrisch um ihren Mittelwert, während die Apple-Aktienkurse sind positiv verzerrt. Das Histogramm der SP Preise liefert starke Hinweise darauf, dass die SP-500 auch unwahrscheinlich ist normal verteilt werden, da ihre Verteilung negativ verzerrt wird.

Formal statistische Tests erforderlich wäre, um zu zeigen, dass weder Verteilung ist normal, aber die Kurven sind sehr suggestiv. Da viele statistische Tests auf der Annahme von Normalität basieren, ist es wichtig, zu bestimmen, ob eine Verteilung wirklich normal ist, bevor Sie eine dieser Tests verwenden.

Menü