Wie man Plot Quantile für Subgruppen in R

Oft wollen Sie die Datenanalyse für verschiedene Untergruppen in R, um zu zerlegen, um sie zu vergleichen. Sie müssen dies tun, wenn Sie wissen wollen, wie die durchschnittliche Lippengröße (übrigens großen Fisch!) Zwischen männlichen und weiblichen kissing gouramis vergleicht oder, im Fall von unserem Beispiel möchten Sie, ob die Anzahl der Zylinder in ein zu wissen, Auto hat Einfluss auf die Kilometerleistung.

Natürlich können Sie verwenden tapply () um einen Faktor Variable definiert eine der deskriptive für Untergruppen zu berechnen. Aber in R Sie noch weitere Tools finden deskriptive für verschiedene Untergruppen für die Zusammenfassung.

Ein Weg, um schnell Gruppen zu vergleichen, ist eine Box-and-Whisker-Plot aus den Daten zu konstruieren. Man könnte diesen Plan erstellen, indem Sie den Bereich der Berechnung der Quartile, und der Median für jede Gruppe, aber zum Glück kann man nur R sagen alles, was für Sie tun. Wenn Sie zum Beispiel, wollen wissen, wie die Laufleistung zwischen Autos mit einer unterschiedlichen Anzahl von Zylindern vergleicht, verwenden Sie einfach die Box-Plot() Funktion:

image0.png
> Boxplot (mpg ~ Zyl, data = Autos)

Sie liefern eine einfache Formel als erstes Argument zu Box-Plot(). Diese Formel lautet wie # 147-Plot-Boxen für die Variable mpg für die Gruppen, die durch die Variable definiert Zyl.# 148;

Dieses Grundstück verwendet Quantile, um Ihnen eine Vorstellung davon, wie die Daten innerhalb jeder Untergruppe verteilt. Die Linie in der Mitte jedes Feld stellt den Median, und die Ränder der Box das erste und das dritte Quartil darstellen. Die Whisker entweder mit dem Minimum und dem Maximum der Daten oder dem 1,5-fachen der Entfernung zwischen dem ersten und dem dritten Quartile erstrecken, je nachdem welche kleiner ist.

Um ganz korrekt ist, stellen die Kanten des Kastens der unteren und oberen Scharniere von der Fünf-Zahlen-Zusammenfassung, berechnet unter Verwendung der fivenum () Funktion. Sie sind gleich den Quartile nur, wenn Sie eine ungerade Anzahl von Beobachtungen in Ihre Daten haben. Andernfalls die Ergebnisse fivenum () und Quantil () ein wenig aufgrund von Unterschieden in den Details der Berechnung kann abweichen.

Sie können die Whiskers lassen immer auf das Minimum verlängern und die maximale durch die Einstellung Angebot Argument der Box-Plot() Funktion 0.

Menü