So verwenden Plots Quantilsgrenzen Datennormalitäts in R zu prüfen

Histogramme lassen viel für die Interpretation des Betrachters. Eine bessere grafische Weise in R zu sagen, ob Ihre Daten normal verteilt ist, ist bei einem sogenannten Quantil-Quantil (QQ) Grundstück zu suchen.

Mit dieser Technik zeichnen Sie gegeneinander Quantile. Wenn Sie zwei Proben vergleichen zu können, zum Beispiel, vergleichen Sie einfach die Quantile beider Proben. Oder, um es ein bisschen anders zu setzen, hat R die folgenden ein QQ-Plot zu konstruieren:

  • Es sortiert die Daten beider Proben.

  • Es zeichnet diese sortierten Werte gegeneinander.

Wenn beide Proben nicht die gleiche Anzahl von Werten enthalten, berechnet R Zusatzwerte durch Interpolation für die kleinste Probe zwei Proben von derselben Größe zu erstellen.

Wie zwei Datenproben zu vergleichen

Natürlich müssen Sie nicht verwenden zu tun, dass alle von Ihnen, können Sie einfach die qqplot () Funktion dafür. Also, um zu überprüfen, ob die Temperaturen während der Aktivität und während der Ruhe gleichmäßig verteilt sind, tun Sie einfach folgendes:

> Qqplot (beaver2 $ temp [beaver2 $ activ == 1] + beaver2 $ temp [beaver2 $ activ == 0])

Dadurch entsteht ein Grundstück, wo die bestellten Werte gegeneinander aufgetragen.

image0.png

Zwischen den eckigen Klammern, können Sie einen logischen Vektor verwenden, um die Fälle zu wählen Sie wollen. Hier findest du alle Fälle wählen, wo die Variable activ gleich 1 für die erste Probe und alle Fälle, in denen diese Variable gleich 0 für die zweite Probe.

Wie ein R QQ-Plot zu verwenden, um Daten Normalität zu überprüfen

In den meisten Fällen wollen Sie nicht zwei Proben miteinander zu vergleichen, sondern eine Probe mit einer theoretischen Probe zu vergleichen, die von einer bestimmten Verteilung kommt (zum Beispiel die Normalverteilung).

Um einen QQ-Plot auf diese Weise machen, hat R die besondere qqnorm () Funktion. Wie der Name schon sagt, zeichnet diese Funktion Ihre Probe gegen eine Normalverteilung. Sie geben einfach die Probe Sie als erstes Argument darstellen möchten und fügen Sie alle grafischen Parameter, die Sie mögen.

R erstellt dann eine Probe mit den Werten aus der kommenden Standard Normalverteilung oder eine Normalverteilung mit einem Mittelwert von Null und einer Standardabweichung von eins. Mit dieser zweiten Probe schafft R die QQ-Plot wie zuvor erläutert.

R hat auch eine qqline () Funktion, die eine Linie zu Ihrem normalen QQ-Plot erstellt. Diese Linie macht es viel einfacher zu beurteilen, ob Sie eine klare Abweichung von der Normalität zu sehen. Je näher alle Punkte liegen auf der Linie ist, desto näher kommt die Verteilung Ihrer Probe auf die Normalverteilung. Das qqline () Funktion nimmt auch die Probe als Argument.

Jetzt wollen Sie dies sowohl der aktiven und der inaktiven Periode des Bibers während für die Temperaturen zu tun. Sie können die Verwendung qqnorm () Funktion zweimal beide Grundstücke zu schaffen. Für die inaktiven Zeiten, können Sie den folgenden Code verwenden:

> Qqnorm (beaver2 $ temp [beaver2 $ activ == 0], main = "Inaktiv")> qqline (beaver2 $ temp [beaver2 $ activ == 0])

Sie können für die aktive Zeit das gleiche zu tun, indem Sie den Wert zu ändern 0 nach 1.

image1.png

Menü