So verwenden read.csv (), um Daten importieren in R

Eine der einfachsten und zuverlässigsten Möglichkeiten, Daten in R immer ist Text-Dateien zu verwenden, insbesondere CSV (Comma Separated Values) Dateien. Die CSV-Dateiformat verwendet Kommas, um die verschiedenen Elemente in einer Linie zu trennen, und jede Zeile von Daten in einer eigenen Zeile in der Textdatei, die ideal CSV-Dateien macht tabellarische Daten für die Darstellung.

Der zusätzliche Vorteil von CSV-Dateien ist, dass fast jede Datenanwendung Export von Daten in das CSV-Format unterstützt. Dies ist sicherlich der Fall für die meisten Tabellenkalkulationsanwendungen, einschließlich Microsoft Excel und Openoffice Calc.

In den folgenden Beispielen wird angenommen, dass Sie eine CSV-Datei in einem geeigneten Ordner im Dateisystem gespeichert haben. Um eine Excel-Tabelle in das CSV-Format zu konvertieren, müssen Sie Datei-Speichern unter zu wählen, die Ihnen die Möglichkeit gibt die Dateien in einer Vielzahl von Formaten zu speichern.

Beachten Sie, dass eine CSV-Datei nur ein einzelnes Arbeitsblatt einer Tabelle darstellen kann. Schließlich müssen Sie die oberste Zeile Ihrer Arbeitsblatt (Zeile 1) für die Spaltenüberschriften zu verwenden.

In R, verwenden Sie die read.csv () Funktionsdaten im CSV-Format zu importieren. Diese Funktion hat eine Anzahl von Argumenten, aber der einzige wesentliche Argument Datei, das gibt den Speicherort und Dateinamen an. So lesen Sie eine Datei mit dem Namen elements.csv befindet sich f: benutzen read.csv () mit Dateipfad:

> Elemente lt; - read.csv (file.path ( "f", "elements.csv"))> str (Elemente) 'data.frame': 10 obs. von 9 Variablen: $ Atomic.number: int 1 2 3 4 5 6 7 8 9 10 $ Name: Faktor w / 10 Stufen "Beryllium", "Bor", ..: 6 5 7 1 2 3 9 10 4 $ 8 Symbol: Faktor w / 10 Stufen "B", "Be", "C", "F", ..: 5 6 7 1 2 3 8 10 4 9 $ Gruppen: int 18 1 2 1 13 14 15 16 17 18 $ Periode: int 1 1 2 2 2 2 2 2 2 2 $ Block: Faktor w / 2 Ebenen "p", "s": 2 2 2 2 1 1 1 1 1 1 $ State.at.STP: Faktor w / 2 Ebenen "Gas", "Solid": 1 1 2 2 2 2 1 1 1 1 $ Vorkommen: Faktor w / 1-Ebene "Primordial": 1 1 1 1 1 1 1 1 1 1 $ Beschreibung: Faktor w / 6 Stufen "Alkalimetall", ..: 6 5 1 2 4 6 6 6 3 5

R importiert die Daten in einem Datenrahmen. Wie Sie sehen können, hat dieses Beispiel zehn Beobachtungen von neun Variablen.

Beachten Sie, dass die Standardoption ist Zeichenketten in Faktoren zu konvertieren. Somit werden die Spalten Name, Block, State.At.STP, Auftreten, und Beschreibung Alle wurden auf Faktoren umgewandelt. Beachten Sie auch, dass R Räume in den Spaltennamen Perioden (zum Beispiel konvertiert, in der Spalte State.At.STP).

Diese Standardoption von Strings Faktoren konvertieren, wenn Sie verwenden read.table () kann eine Quelle großer Verwirrung. Sie sind oft besser Importieren von Daten, die Strings in einer solchen Art und Weise enthält, dass die Saiten nicht umgewandelten Faktoren sind, bleiben aber Zeichen Vektoren. So importieren Sie Daten, die Strings enthält, verwenden Sie das Argument stringsAsFactors = FALSE nach read.csv () oder read.table ():

> Elemente lt; - read.csv (file.path ( "f", "elements.csv"), stringsAsFactors = FALSE)> str (Elemente) 'data.frame': 10 obs. von 9 Variablen: $ Atomic.number: int 1 2 3 4 5 6 7 8 9 10 $ Name: chr "Wasserstoff" "Helium" "Lithium" "Beryllium" ... $ Symbol: chr "H" "Er" " Li "" Be "... $ Gruppen: int 18 1 2 1 13 14 15 16 17 18 $ Periode: int 1 1 2 2 2 2 2 2 2 2 $ Block: chr" s "" s "" s "" s "... $ State.at.STP: chr" Gas "" Gas "" Solid "" Solid "... $ Vorkommen: chr" Primordial "" Primordial "" Primordial "" Primordial "... $ Beschreibung: chr "Nicht-Metall" "Edelgas" "Alkalimetall" "Erdalkalimetall" ...

Wenn Sie eine Datei in der EU (Europäische Union) Format haben (wo Kommas verwendet werden als Dezimaltrennzeichen und Semikolons als Feldtrennzeichen verwendet wird), müssen Sie es auf R zu importieren die Verwendung von read.csv2 () Funktion.

Menü