Wie man einen Boxplot aus einem Fünf-Nummer tätigen

EIN Box-Plot ist eine eindimensionale graphische Darstellung von numerischen auf der fünfNummer Zusammenfassung basierte Daten. Diese Zusammenfassung enthält die folgenden Statistiken: den Mindestwert, der 25. Perzentile (bekannt als Q1), Der Median, der 75. Perzentile (Q3), Und der Maximalwert. Im Wesentlichen teilen diese fünf deskriptiven Statistiken, die in vier Teile Datensatz, wobei jedes Teil 25% der Daten enthält.

Um einen boxplot machen, gehen Sie folgendermaßen vor:

  1. Finden Sie die Fünf-Nummer Zusammenfassung Ihrer Datensatz:

    Das Minimum der kleinste Wert in dem Datensatz, und die maximal ist der größte Wert im Datensatz. Verwenden Sie die folgenden Schritte, um das 25. Perzentil zu finden (auch bekannt als Q1), Das 50. Perzentil (der Median) und das 75. Perzentil (Q3).

  1. Um alle Werte in den Datensatz vom kleinsten zum größten.

  2. Multiplizieren k Prozent-fache der Gesamtzahl der Werte in den Daten, n.

    Das Ergebnis wird als das bekannte Index.

  3. Wenn der Index, erhalten in Schritt 2 keine ganze Zahl ist, runden sie auf die nächste ganze Zahl und gehen 4a zu Schritt.

    Wenn der Index, erhalten in Schritt 2 eine ganze Zahl ist, gehen 4b zu Schritt.

  4. Wähle eines der Folgenden.

    ein. Zählen Sie die Werte in Ihren Datensatz von links nach rechts (vom kleinsten bis zum größten Wert), bis Sie bei der angegebenen Nummer erreichen Schritt 3. Der entsprechende Wert im Datensatz der kth Perzentil.

    b. Zählen Sie die Werte in Ihren Datensatz von links nach rechts (vom kleinsten zum größten), bis Sie erreichen bei der angegebenen Nummer von Schritt 2. Die kth Perzentil ist der Durchschnitt dieser entsprechenden Wert in Ihrem Datensatz und dem Wert, folgt unmittelbar.

  • Erstellen Sie eine vertikale (oder horizontal) Zahl Linie, deren Maßstab die Werte in der Zusammenfassung fünf Nummer enthält und verwendet entsprechende Einheiten gleichen Abstand voneinander.

  • Markieren Sie die Position der einzelnen Wert in der Fünf-Zahlen Zusammenfassung knapp über der Zahl Linie (für eine horizontale boxplot) oder einfach nur nach rechts von der Zahlengeraden (für eine vertikale boxplot).

  • Zeichnen Sie ein Feld um die Markierungen für den 25. Perzentil und dem 75. Perzentil.

  • Zeichnen Sie eine Linie in der Box, in der Median befindet.

  • Bestimmen Sie, ob nicht Ausreißer vorhanden sind.

    Um diese Bestimmung zu machen, berechnen die Quartils Range (IQB), die gefunden wird durch Subtraktion Q3 - Q1- dann multiplizieren IQB von 1,5. Fügen Sie diese Menge auf den Wert von Q3und subtrahieren diesen Betrag von Q1. Dies gibt Ihnen eine breitere Grenze um den Median als die Box tut. Alle Datenpunkte, die außerhalb dieser Grenze fallen, sind entschlossen, Ausreißer zu sein.

  • Wenn es keine Ausreißer (gemäß den Ergebnissen von Schritt 6) sind, Linien zeichnen von den oberen und unteren Rändern der Box heraus auf die Minimal- und Maximalwerte im Datensatz.

  • Wenn es Ausreißer (nach den Ergebnissen von Schritt 6), zeigen ihren Standort auf dem boxplot mit * Zeichen.

    Statt eine Linie vom Rand des Kastens den ganzen Weg bis zum extremen Ausreißer der Zeichnung, die Linie an der letzten Datenwert zu stoppen, die nicht ein Ausreißer ist.

  • Viele, wenn nicht die meisten Software-Pakete zeigen Ausreißer in einem Datensatz durch ein Sternchen (*) oder Stern-Symbol verwenden und das Verfahren in Schritt 6 Ausreißer skizziert verwenden zu identifizieren. Allerdings sind nicht alle Pakete verwenden diese Symbole und procedures- überprüfen, um zu sehen, was Ihr Paket tut, bevor Sie Ihre Daten mit einem boxplot analysieren.

    Boxplot Beste Schauspielerin im Alter (1928 -2009- & lt; i>nlt;. / i> = 83 Schauspielerinnen)
    Boxplot Beste Schauspielerin Alter (1928-2009- n = 83 Schauspielerinnen).

    Eine horizontale boxplot für Alter der Beste Schauspielerin Oscar-Preisträger aus 1928-2009 in der obigen Abbildung dargestellt. Sie können sehen, die Zahlen Abschnitte der Trennung der fünf-Nummer Auswertungsstatistiken in der folgenden Abbildung dargestellt boxplot entsprechen.

    Beschreibende Statistik für die Beste Schauspielerin Alter (1928-2009).
    Beschreibende Statistik für die Beste Schauspielerin Alter (1928-2009).

    Boxplots kann von unten (niedrigste) gehen (nach oben und unten gerade) mit den Werten auf der Achse vertikal nach oben (höchste) - oder sie können von der Horizontalen sein, links mit den Werten auf der Achse gehen (niedrigste) nach rechts (höchste ).

    Die Schritte, die hier gezeigt zeigen eine Möglichkeit, den Median und Quartile der Fünf-Zahlen Zusammenfassung Berechnung und die boxplot der Konstruktion. Aber es gibt mehrere andere akzeptable Methoden. Seien Sie nicht zu alarmierten, wenn Ihr Rechner oder ein Freund gibt Ihnen einen boxplot der Nähe aber anders aus, was diese Schritte geben würde.

    Menü