Wie zu eindeutigen Datenwerte in R Count

Um herauszufinden, welche Daten berücksichtigt werden, wenn die in R, lassen Sie uns auf dem Datensatz einen Blick mtcars. Dieser Einbau-Dataset beschreibt den Kraftstoffverbrauch und die zehn verschiedenen Design-Punkte von 32 Autos aus den 1970er Jahren. Es enthält in Summe 11 Variablen, aber alle von ihnen sind numerisch.

Obwohl Sie als mit dem Datenrahmen arbeiten können, könnten einige Variablen zu einem Faktor umgerechnet werden, da sie eine begrenzte Anzahl von Werten aufweisen.

Wenn Sie nicht wissen, wie viele verschiedene Werte eine Variable hat, können Sie diese Informationen in zwei einfachen Schritten erhalten:

  1. Holen Sie sich die einzigartigen Werte der Variablen verwenden einzigartig().

  2. Holen Sie die Länge des resultierenden Vektors unter Verwendung von Länge().

Verwendung der sapply () Funktion können Sie dies sofort für den gesamten Datenrahmen tun. Sie wenden eine anonyme Funktion beide genannten Schritte auf den gesamten Datenrahmen, wie diese Kombination von:

> Sapply (mtcars, Funktion (x) Länge (unique (x))) mpg Zyl disp hp drat wt QSEC vs am Getriebe carb25 27 22 22 3 29 30 2 2 3 6

So sieht es aus wie die Variablen Zyl, vs, bin, Gang, und carb kann aus einer Umwandlung profitieren zu Faktor.

Sie haben 32 verschiedene Beobachtungen in diesem Datensatz so keine der Variablen hat nur eindeutige Werte.

Wenn eine Variable zu behandeln wie ein Faktor auf die Situation ein wenig ab, aber in der Regel mehr als zehn verschiedenen Ebenen in einem Faktor zu vermeiden und versuchen, mindestens fünf Werte pro Level zu haben.

Menü