So bereiten Sie Daten in R

Mit R an Ihren Fingerspitzen, können Sie Ihre Daten schnell Form genau so, wie Sie es wollen. Das ist gut, weil in vielen realen Fällen, Sie Haufen von Daten in einer großen Datei zu erhalten, und vorzugsweise in einem Format, das Sie können nicht verwenden. Das muss die goldene Regel der Datenerfassung sein: Stellen Sie sicher, dass Ihre Statistiker schwitzt seine Hose nur, indem man die Daten suchen.

Auswählen nur die Variablen, die Sie brauchen, und sie in das richtige Format verwandeln wird ziemlich einfach, mit Tricks in R.

Lassen Sie uns die Datenrahmen vorbereiten mtcars ein bisschen ein paar einfache Tricks. Erstellen Sie zunächst einen Datenrahmen Autos so was:

> Autos lt; - mtcars [c (1,2,9,10)]> Autos $ Getriebe lt; - bestellt (Autos $ Gang)> Autos $ Uhr lt; - Faktor (Autos $ Uhr, Etiketten = c ( 'auto', 'manuell'))

Mit diesem Code, tun Sie Folgendes:

  • Wählen Sie vier Variablen aus dem Datenrahmen mtcars und sie in einem Datenrahmen speichern genannt Autos. Beachten Sie, dass Sie das Index-System für Listen verwenden, um die Variablen auszuwählen.

  • Sprechen Sie die Variable Gang in dieser Daten eine geordnete Faktor umrahmen.

  • Geben Sie die Variable bin der Wert 'Auto' wenn seine ursprüngliche Wert ist 1, und 'Handbuch' wenn seine ursprüngliche Wert ist 0.

  • Wandeln Sie die neue Variable bin zu einem Faktor.

Bei der Umsetzung von Autos $ Uhr, Sie feststellen, dass das erste Argument der ansonsten() Aussage ist nicht ein logischer Ausdruck. Die ursprüngliche Variable 0 und 1 als Werte, und R a liest 0 wie FALSCH und alles andere als WAHR. Sie können diese Eigenschaft in Ihrem eigenen Code verwenden, wie bereits gezeigt.

Nach diesen Code ausführen, sollten Sie einen Datensatz haben Autos in Ihrem Arbeitsbereich mit der folgenden Struktur:

> Str (Autos) 'data.frame': 32 obs. von 4 Variablen: $ mpg: num 21 21 22,8 21,4 18,7 ... $ Zyl: num 6 6 4 6 8 ... $ Uhr: Faktor w / 2 Ebenen "auto", "manuell": 1 1 1 2 2. .. $ Getriebe: Ord.factor w / 3 Stufen "3" lt; "4" lt; "5": 2 2 2 1 1 ...

Menü