Wie Spot Statistische Variability in einem Histogramm

Sie können durch einen Blick auf das Histogramm ein Gefühl der Variabilität in einem statistischen Datensatz erhalten. Wenn beispielsweise die Daten alle gleich sind, sind sie alle in einer einzigen bar gebracht, und es gibt keine Variabilität. Wenn eine gleiche Menge an Daten in jeder von mehreren Gruppen ist, sieht das Histogramm flach mit den Bars in der Nähe der gleichen höhen- signalisiert dies eine angemessene Menge an Variabilität.

Die Idee eines flachen Histogramm eine gewisse Variabilität angibt, gegen Ihre Intuition gehen kann, und wenn ja du bist nicht allein. Wenn Sie eine flache Histogramm denken keine Variabilität bedeutet, denken Sie wahrscheinlich über ein Zeitdiagramm, in dem einzelne Zahlen über die Zeit aufgetragen. Denken Sie aber daran, dass ein Histogramm zeigt keine Daten über die Zeit - sie alle Daten an einem Punkt in der Zeit zeigt. Da das Histogramm flach ist, bedeutet dies, dass die Daten über das gesamte Spektrum verteilt, damit eine hohe Variabilität.

Ebenso interessant ist die Idee, dass ein Histogramm mit einem großen Klumpen in der Mitte und Schwänze auf jeder Seite scharf nach unten abfallend tatsächlich weniger Variabilität als ein Histogramm, das gerade über ist. Die Kurven wie Hügel in einem Histogramm suchen repräsentieren Klumpen von Daten, die nahe beieinander liegen, damit eine geringe Variabilität.

Variability in einem Histogramm ist höher, wenn die höheren Stäbe mehr verteilt sind weg von der mittleren und unteren, wenn die höheren Stäbe sind in der Nähe des Mittelwertes.

bild0.jpg

Für die beste Schauspielerin Oscar-Preisträger das Alter in der obigen Abbildung gezeigt, sehen Sie viele Schauspielerinnen im Alter zwischen 30 bis 35 sind, und die meisten der Schauspielerinnen sind zwischen 20 bis 50 Jahren im Alter, die dann ganz Diverse- ist, dass Sie diese Ausreißer haben, die wenigen älteren Schauspielerinnen (7 von ihnen), die die Daten aus weiter verbreiten, um die Daten der gesamten Schwankungsbreite zu erhöhen.

Die häufigste Statistik zu messen Variabilität in einem Datensatz verwendet ist die Standardabweichung, die in einem groben Sinn misst die "mittlere" oder "typisch" Abstand, dass die Daten liegen aus dem Mittelwert. Die Standardabweichung für die Beste Schauspielerin Altersdaten ist 11,35 Jahre. Eine Standardabweichung von 11,35 Jahre ist im Rahmen dieses Problems ziemlich groß, aber die Standardabweichung auf mittlere Entfernung vom Mittelwert basiert, und der Mittelwert wird von Ausreißern beeinflusst, so wird die Standardabweichung als auch beeinflusst werden.

Menü