Zeigen die Verteilung mit Histogramme

Histogramme

Menu

sind Balkendiagramme, die in bestimmten Intervallen fallende Werte, welcher Anteil der Probanden zeigen haben. Der Hauptzweck eines Histogramms ist es, Ihnen zu zeigen, wie sich die Werte eines numerischen Werts verteilt sind. Diese Verteilung ist eine Approximation der wahren Population Frequenzverteilung für die Variable.

bild0.jpg

Die glatte Kurve zeigt, wie IQ-Werte werden in einer unendlich großen Bevölkerung verteilt. Die Höhe der Kurve bei jedem IQ-Wert ist auf den Anteil der Bevölkerung in der unmittelbaren Nähe des IQ proportional. Diese Kurve hat die typische # 147-Glocke # 148- Form einer Normalverteilung.

Das Histogramm zeigt an, wie sich die IQs von 60 Probanden zufällig aus der Bevölkerung Stichprobe könnte verteilt werden. Jeder Balken stellt ein Intervall von IQ-Werte mit einer Breite von zehn IQ Punkte und die Höhe jedes Balkens ist proportional zu der Anzahl der Probanden in der Probe, deren IQ innerhalb dieses Intervalls fiel.

Lognormalverteilungen

Da eine Probe der Bevölkerung nur eine unvollkommene Darstellung ist, kann die genaue Form einer Verteilung der Bestimmung schwierig sein, es sei denn Ihre Stichprobengröße sehr groß ist. Dennoch, in der Regel ein Histogramm hilft Ihnen vor Ort schiefe Daten.

Eine schiefe Form ist typisch für ein lognormalen Verteilung, die in der biologischen Arbeit sehr häufig auftritt. Man nennt es lognormalen denn wenn man den Logarithmus von jedem Datenwert nehmen (es spielt keine Rolle, welche Art von Logarithmus Sie nehmen), müssen die daraus resultierenden Protokolle eine Normalverteilung.

image1.jpg

So ist es empfehlenswert, ein Histogramm für jede numerische Variable zur Vorbereitung Sie analysieren planen, um zu sehen, ob es merklich verzerrt, und wenn ja, ob eine logarithmische # 147-Transformation # 148- macht die Verteilung mehr fast normal.

Andere abnorme Verteilungen

Log-Normalität ist nicht die einzige Art von Nicht-Normalität, die in der realen Welt Daten entstehen können. Je nach dem zugrunde liegenden Verfahren, die zu den Daten ergibt, können die Zahlen in anderer Weise verteilt werden.

Zum Beispiel verhalten Ereignis zählt oft nach der Poisson-Verteilung und kann, zumindest annähernd, normalisiert durch die Quadratwurzel jeder Zählung unter (anstelle des Logarithmus, wie Sie für log-normalen Daten tun). mit zwei (oder mehr) Spitzen schräg Daten oder auf Daten, noch andere Prozesse können zu verlassen geben.

Was ist, wenn weder der Log-Normal noch die Quadratwurzel-Transformation Ihre schrägen Daten normalisiert? Ein Ansatz ist die zu verwenden Box-Cox Transformation, die diese allgemeine Formel hat: Transformierte X = (XEIN- 1) /EIN, woher EIN ist ein einstellbarer Parameter, die Sie von negativen zu positiven Werten variieren kann.

Je nach dem Wert von EIN, Diese Umwandlung kann oft machen links, schräg oder rechts, schräg Daten mehr symmetrisch (und normal verteilt). Die Abbildung zeigt, wie die Box-Cox-Transformation verzerrte Daten normalisieren helfen kann.

image2.jpg

Einige Software können Sie variieren EIN durch eine Reihe von positiven oder negativen Werten einen Schieberegler auf dem Bildschirm, die Sie mit der Maus bewegen kann. Wie Sie schieben die EIN Wert hin und her, sehen Sie das Histogramm von links seine Form ändern, schräg zu symmetrisch nach rechts; verzerrt. Hier verwenden EIN = 0,12 normalisiert recht gut die Daten.

Wann EIN ist genau 0, wird die Box-Cox Formel 0/0, was unbestimmt ist. Aber es kann gezeigt werden, daß als EIN gegen 0 (entweder von der positiven oder negativen Seite), wobei die Box-Cox Formel die gleiche wie die Logarithmusfunktion wird. So ist die logarithmische Transformation ist nur ein Spezialfall des allgemeineren Box-Cox-Transformation.

Wenn Sie keine Transformation finden können, dass Ihre Daten auch nur annähernd normal aussehen macht, dann müssen Sie Ihre Daten analysieren mit nichtparametrischer Methoden, die nicht davon ausgehen, dass Ihre Daten normal verteilt ist.

Menü