Wie die Variation von Daten in R zu beschreiben

Eine einzelne Zahl nicht sagen nicht, dass Sie viel über Ihre Daten. Oft ist es so wichtig, die Verbreitung Ihrer Daten zu kennen. Sie können R verwenden in dieser Spanne zu sehen eine Reihe von verschiedenen Ansätzen.

Erstens können Sie berechnen, entweder die Unterschied oder der Standardabweichung die Ausbreitung in einer einzigen Zahl zusammenfassen. Dazu müssen Sie die praktischen Funktionen var () für die Varianz und sd () für die Standardabweichung. Zum Beispiel berechnen Sie die Standardabweichung der Variablen mpg in dem Datenrahmen Autos so was:

> Sd (Autos $ mpg) [1] 6,026948

Neben dem Mittelwert und Variation, können Sie auch einen Blick auf die Quantile nehmen. EIN Quantil, oder Perzentile, sagt Ihnen, wie viel Ihrer Daten unter einem bestimmten Wert liegt. Die 50-Prozent-Quantil, ist beispielsweise nichts anderes als der Median. Auch hier hat R einige nützliche Funktionen helfen Ihnen bei der Quantile suchen.

Wie man Datenbereich in R berechnen

Die am häufigsten verwendeten Quantile sind eigentlich die 0 Prozent und 100 Prozent Quantile. Sie könnten genauso gut ihnen das Minimum nennen und Maximum, denn das ist, was sie sind. Sie können beide bekommen min () und max () Funktionen zusammen die Angebot() Funktion. Diese Funktion gibt Ihnen bequem den Bereich der Daten. Also, um zu wissen, zwischen denen zwei Werte alle mileages gelegen sind, tun Sie einfach folgendes:

> Bereich (Pkw $ mpg) [1] 10.4 33.9

Wie berechnen Daten Quartile in R

Der Bereich immer noch gibt Ihnen nur begrenzte Informationen. Oft Statistiker den ersten Bericht und die dritte Quartil neben dem Bereich und dem Median. Diese Quartile sind jeweils die 25 Prozent und 75 Prozent Quantile, die die Zahlen, für die ein Viertel und drei Viertel der Daten kleiner ist. Sie erhalten diese Nummern mit Quantil () Funktion, wie folgt aus:

> Quantil (Autos $ mpg) 0% 25% 50% 75% 100% 10,400 15,425 19,200 22,800 33,900

Die Quartile sind nicht die gleichen wie die untere und obere Scharnier in der Zusammenfassung von fünf Zahl berechnet. Die beiden letztgenannten sind jeweils der Median der unteren und der oberen Hälfte der Daten, und sie unterscheiden sich geringfügig von dem ersten und dem dritten Quartil. Um die fünf Zahl Statistiken erhalten, verwenden Sie die fivenum () Funktion.

Wie auf der Geschwindigkeit, mit der Quantilsfunktion in R zu erhalten

Das Quantil () Funktion kann Ihnen jede Quantils Sie wollen. Dazu verwenden Sie die probs Streit. Sie geben die probs (Oder Wahrscheinlichkeiten) als Bruchzahl. Für die 20 Prozent Quantil zum Beispiel verwenden Sie 0,20 als Argument für den Wert. Dieses Argument nimmt auch einen Vektor als ein Wert, also Sie können zum Beispiel erhalten die 5 Prozent und 95 Prozent Quantile wie folgt aus:

> Quantil (Cars $ mpg, c probs = (0,05, 0,95)) 5% 95% 11.995 31.300

Der Standardwert für die probs Argument ist ein Vektor, der das Minimum (0), das erste Quartil (0,25), der Median (0,5), das dritte Quartil (0,75) und die maximale (1).

All diese Funktionen haben ein Argument na.rm dass können Sie alle zu entfernen N / A Werte vor der jeweiligen statistischen Berechnung. Wenn Sie dies nicht tun, jeder Vektor enthält, N / A werde haben N / A als Ergebnis. Dies funktioniert genauso wie die na.rm Argument der Summe() Funktion.

Menü