Zentrale Tendenz: Beyond the Basics

Die mittlere und die mediane sind die beiden zuverlässigsten und am häufigsten Maßnahmen des Zentrums berichtet, und sie sind in einer Vielzahl von Situationen verwendet. Allerdings, wenn Sie sind ernsthaft Statistiken zu studieren, sollten Sie mit zwei anderen Maßnahmen der zentralen Tendenz vertraut sein.

Menu

Modus

Das Modus ist ein weiteres Maß für Zentrum, das die Wert (oder Wertebereich) tritt am häufigsten berechnet. Der Mittelwert und Median kann bei der Beschreibung symmetrisch und unimodal Verteilungen sehr effektiv sein. Der Modus ist nützlich zur Erläuterung Situationen, dass der Mittelwert und Median kann nicht, insbesondere schräg oder multimodalen Daten.

Um den Modus zu berechnen, erstellen Sie einfach eine Frequenztabelle aller möglichen Werte und zählen die Anzahl der jeweils angezeigt. wenn der Datensatz enthält beispielsweise 10, 20, 20, 20, 30, 30, 40, 50, 50- dann der Modus 20 ist.

Wenn Sie einen Datensatz haben, die keine Werte haben, die exakt wiederholt werden, können Sie sie in Bereiche, ähnlich wie Sie Split für die Herstellung eines Histogramms vorzubereiten. Zum Beispiel in der folgenden Tabelle, zwei Spieler auf die Lakers machen die NBA-Liga Minimum, so dass der Modus könnte in Betracht gezogen werden $ 959.111 zu sein. Alternativ können Sie die Daten in Gruppen von $ 1 Million geteilt, wobei der Modus der Bereich von $ 5-6000000, weil vier Spieler in dieser Gruppe fallen würde.

Die Gehälter für L. A. Lakers NBA-Spieler (2009-2010)
SpielerGehalt ($)
Kobe Bryant23034375
Pau Gasol16452000
Andrew Bynum12526998
Lamar Odom7500000
Ron Artest5854000
Adam Morrison5257229
Derek Fisher5048000
Sasha Vujacic5000000
Luke Walton4840000
Shannon Brown2000000
Jordan Farmar1947240
Didier Ilunga-Mbenga959111
Josh Powell959111
Gesamt91378064

Der Modus kann durch die Spitze in einem Histogramm dargestellt werden. Bei Datensätzen, die mehrere Spitzen haben, ist es nicht ungewöhnlich, mehrere Modi zu berichten, weil der Mittelwert und der Median nicht genau wiedergeben kann, wo die meisten Werte liegen.

Getrimmten Mittelwert

Sie haben gesehen, dass die mittlere Ausreißern anfällig ist und sein wird # 147-gezogen # 148- zu den extremsten Werte. Das getrimmten Mittelwert (oder abgeschnittene Mittelwert) Versucht, den Einfluss von Ausreißern durch Abschneiden einer kleinen Anzahl von Extremwerten zu eliminieren, so dass die mittlere mehr auf den zentralen Werten konzentriert.

Zur Berechnung einer mittleren getrimmt, wählen Sie einen kleinen Prozentsatz Ihres Datensatzes (etwa 10 Prozent), teilen Sie diese Zahl in der Hälfte, entfernen Sie den entsprechenden Prozentsatz der Werte aus den beiden unteren und oberen Ende, und dann den Mittelwert der verbleibenden Werte.

Beispiel: Angenommen, ein Datensatz enthält die folgenden n = 20 Werte: 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 9, 500. Der Ausreißerwert von 500 Laufwerke die (traditionell) Probe bedeuten 29,6, zu sein, die aber einer der Datenwerte größer als alle und nicht wirklich anzeigt, wo die Action ist.

Stattdessen können Sie die extremste 10 Prozent ausgeschnitten, die zwei Werte Entfernungsmittel (10% x 20 = 20), und nur eine mittlere berechnen basierend auf der mittleren 90 Prozent der Werte. Da Sie, dass zwei zwischen den beiden Enden zu teilen haben, werden Sie eine aus dem unteren Ende (3) und einer aus dem High-End (500) entfernen. Die 90 Prozent bedeuten, auf den verbleibenden 18 Datenwerte getrimmte basierend 4,9 und besser, die zentrale Tendenz der Daten widerspiegelt.

Menü