Box-Plots: Graphische Technik für die statistische Daten

EIN Box-Plot ausgelegt ist, mehrere wichtige Statistiken für einen Datensatz in Form eines vertikalen Rechtecks ​​oder Feld zu zeigen. Die Statistiken können sie zeigen, gehören die folgenden:

  • Minimalwert

  • Maximalwert

  • Erstes Quartil (Q1)

  • Zweites Quartil (Q2)

  • Drittes Quartil (Q3)

  • Quartilsbereich (IQB)

Das erste Quartil eines Datensatzes ist eine Maßzahl, die die Daten in zwei Teile teilt: die kleinste 25 Prozent der Beobachtungen und der größten 75 Prozent der Beobachtungen. Mit anderen Worten ist das erste Quartil ein numerischer Wert, mit den folgenden Eigenschaften:

  • 25 Prozent der Beobachtungen im Datensatz sind kleiner als das erste Quartil.

  • 75 Prozent der Beobachtungen im Datensatz sind größer als das erste Quartil.

Auch der im zweiten Quartil (Auch bekannt als Median) Teilt die Daten in die Hälfte, also 50 Prozent der Elemente kleiner sind als der Median und 50 Prozent größer sind.

Das dritte Quartil ist der Wert, für die die folgenden Bedingungen erfüllt sind:

  • 75 Prozent der Beobachtungen im Datensatz sind kleiner als das dritte Quartil.

  • 25 Prozent der Beobachtungen im Datensatz sind größer als das dritte Quartil.

Das Quartilsabstand (IQB) die Differenz zwischen dem dritten Quartil und dem ersten Quartil: IQR = Q3 - Q1.

Der Quartilsabstand ist ein Maß für Dispersions- es zeigt, wie viel Streuung zwischen den Elementen in der mittleren 50 Prozent eines Datensatzes ist.

Ein Box-Plot wird gezogen, so dass

  • Die Oberseite der Box stellt die dritte Quartil (Q3) Der Daten.

  • Der Boden der Box stellt die erste Quartil (Q1) Der Daten.

  • Die Mitte der Box (mit einer Linie dargestellt) stellt die im zweiten Quartil (Q2).

Darüber hinaus gibt es eine Linie über das Feld, um anzuzeigen, die maximal Wert in den Daten, die nicht Q nicht überschreitet3 + 1,5 x IQR und eine Linie unten das Feld, um anzuzeigen, die Minimum Wert in den Daten, die unter Q nicht fallen1 - 1,5 x IQB. Werte außerhalb dieses Bereichs liegen Ausreißer und sind auf der Box-Plot als einzelne Punkte dargestellt.

Diese Figur zeigt einen Box-Plot der Tagespreise der Microsoft-Aktie ab 1. Januar 2013 bis 31. Dezember 2013.

Box-Plot von Tagespreise für Microsoft-Aktie.
Box-Plot von Tagespreise für Microsoft-Aktie.

Es gibt keine Ausreißer in dieser Daten. Daher zeigt die untere Zeile in der Box-Plot, dass der niedrigste Preis in dieser Zeit war etwas weniger als $ 26.00, und die obere Zeile zeigt, dass der höchste Preis war etwas mehr als 38 $. Der Boden der Box entspricht dem ersten Quartil, der mit dem zweiten Quartil entspricht $ 27.43- die durchgezogene Linie in der Mitte des Kastens (Median), die 31,89 $ ist. Die Oberseite der Box entspricht dem dritten Quartil, die 33,78 $ ist. Die Höhe der Box entspricht der Quartilabstand (IQB), die 6,35 $ ist.

Als weiteres Beispiel zeigt diese Figur eine Box-Plot der Tagespreise von Apple-Aktie ab 1. Januar 2013 bis 31. Dezember 2013.

Box-Plot der täglichen Preise für Apple-Aktie ab 1. Januar 2013 bis 31. Dezember 2013.
Box-Plot der täglichen Preise für Apple-Aktie ab 1. Januar 2013 bis 31. Dezember 2013.

Der niedrigste Preis im Jahr 2013 für Apple-Aktie war 53,84 $, und der höchste Preis war $ 80,11. Es gibt keine Ausreißer in den Daten, so werden diese Werte von der unteren Zeile und oberen Zeile gezeigt.

Die erste Quartil, am unteren Rand der Box gezeigt, war $ 60,48. Der zweite Quartil war $ 63,65 (durch die durchgezogene schwarze Linie dargestellt) und das dritte Quartil war 70,32 $, an der Spitze des Feldes gezeigt. Als Ergebnis ist der Quartilbereich (IQB) 9,84 $.

Menü