Stem-and-Blatt-Diagramme: Graphische Technik für die statistische Daten

EIN Stamm-und-Blatt-Diagramm in dem eine grafische Gerät die Verteilung eines Datensatzes durch den Zahlenwert der Beobachtungen im Datensatz organisiert ist. Das Diagramm besteht aus einem "Stamm", die verschiedenen Kategorien in der Daten, die zeigen, und ein "Blatt", die die Werte der einzelnen Beobachtungen im Datensatz zeigt.

Zum Beispiel ist das folgende ein Stamm-Blatt-Diagramm für die täglichen Preise der Microsoft-Aktie ab 1. Januar 2013 bis 31. Dezember 2013. Die Preise von $ 25,16 auf $ 38,14 Bereich:

bild0.jpg

Auf der Stamm-und-Blatt-Diagramm, wobei jede Zeile einen einzelnen Kategorie- zu diesem Datensatz darstellt, ist jeder Kategorie einen Dollar-Betrag. Zum Beispiel besteht die Kategorie 32 aller Preise zwischen 32,00 $ und 32,99 $. Jeder Preis für Microsoft-Aktie wird in Dollar und Cent angegeben. Die linke Seite der Leiste zeigt die US-Dollar (die Stiele) - die rechte Seite der Leiste zeigt die Cent (die Blätter), nachdem auf die nächsten 10 Cent gerundet wird. Zum Beispiel wird ein Preis von 32,23 $ gerundet auf 32,20 $, und dies erscheint als 2 auf der rechten Seite, der rechten Seite der Bar für die Kategorie 32. Ein Preis von $ 33,48 auf $ gerundet 33.50- dies als 5 auf der rechten Seite angezeigt wird; Hand Seite der Bar für die Kategorie 33.

Mit dieser Technik ist es leicht zu sehen, wie viele Preise in jeder Kategorie fallen. Zum Beispiel gab es 14 Handelstagen in dem Datensatz, in dem der Preis der Microsoft-Aktie lag zwischen 25,00 $ und 25,99 $. Es gab drei Handelstagen, in denen der Preis der Microsoft-Aktie lag zwischen 29,00 $ und 29,99 $. Ein Preis zwischen 33,00 $ und 33,99 $ kam es am häufigsten, und ein Preis zwischen 38,00 $ und 38,99 $ war die selten im Laufe des Jahres.

Einer der Vorteile einer Stem-and-leaf Diagramm ist, dass es einfach ist, die zu identifizieren, Modus eines Datensatzes. (Daran erinnern, dass der Modus der Wert ist, der in einem Datensatz am häufigsten auftritt.) Wenn Sie nur an den Dollar Bereiche schauen, dann ist es leicht zu erkennen, welcher Bereich die meisten Beobachtungen enthält - die mit der längsten Blatt. In diesem Fall wird ein Preis in der 33-Bereich ($ 33.00- $ 33,99) kommt in Betracht der Modus sein, weil es die meisten Beobachtungen enthält.

Ein weiterer Vorteil dieses Schemas ist, dass Ausreißer vor Ort sind leicht zu. Ein Ausreißer ist eine Beobachtung in einem Datensatz, der deutlich größer oder kleiner als die anderen Beobachtungen im Datensatz ist. zwischen entweder dem ersten oder letzten Schaft und dem nächsten nächstgelegene ein Ausreißer würde durch eine große Lücke angezeigt werden. (Kapitel 10 spricht mehr über Ausreißern.)

Ein Nachteil bei der Stamm-Blatt-Diagramme ist, dass sie schwierig werden, für große Datensätze zu interpretieren, da die Größe des Blattes unhandlich wird.

Menü