Wie zum Zentrum von Continuous Data in R Beschreiben

Sie haben den Datensatz und Sie haben es formatiert Ihre Bedürfnisse in R zu passen, so jetzt bist du für die eigentliche Arbeit bereit. Analysieren der Daten beginnt immer mit ihm zu beschreiben. Auf diese Weise können Sie Fehler in den Daten erkennen, und Sie können von den Daten, die Sie haben, welche Modelle geeignet sind, entscheiden, um die Informationen, die Sie benötigen.

Welche deskriptiven Statistiken Sie verwenden, hängt von der Art der Daten, natürlich.

Manchmal sind Sie mehr daran interessiert, in das allgemeine Bild Ihrer Daten, als Sie in den einzelnen Werten sind. nicht in der Laufleistung von jedem Auto, aber in der durchschnittlichen Fahrleistung aller Autos von diesem Datensatzes können Sie interessiert sein. Dazu berechnen Sie den Mittelwert der Verwendung bedeuten() Funktion, wie folgt aus:

bedeuten> (Autos $ mpg) [1] 20,09062

Sie könnten auch die durchschnittliche Anzahl der Zylinder berechnen diese Autos haben, aber das ist wirklich nicht sinnvoll. Die durchschnittliche würde 6,1875 Zylinder sein, und keine Autos fahren mit einem unvollständigen Zylinder. In diesem Fall ist die Median - die meisten zentralen Wert in Ihrer Daten - macht mehr Sinn. Sie erhalten den Median von der Funktion Median(), so was:

> Median (Autos $ Zyl) [1] 6

Es gibt zahlreiche andere Gründe für den Median der Berechnung anstelle des Mittelwerts, oder auch beides zusammen. Beide Statistiken beschreiben eine andere Eigenschaft der Daten, und auch die Kombination kann Ihnen etwas sagen.

Menü