Wie Fix Datenlesefehler in R

Wahrscheinlich sind die häufigsten Fehler bei der R gemacht werden, während in der Daten aus Textdateien lesen mit read.table () oder read.csv (). Viele Fehler führen in R Wurffehler, aber manchmal merkt man nur etwas schief gegangen, wenn man sich die Struktur Ihrer Daten zu suchen. Im letzteren Fall finden Sie oft, dass einige oder alle Variablen auf Faktoren umgewandelt werden, wenn sie sollten wirklich nicht sein.

Wenn R Fehler oder die Struktur Ihrer Daten gibt, ist nicht das, was Sie denken, es sein sollte, überprüfen Sie folgende Punkte:

  • Haben Sie vergessen, das Argument angeben header = TRUE? Wenn ja, wird R die Spaltennamen als Werte sehen und, als Folge, jede Variable auf einen Faktor wandeln, wie sie es immer tut mit Zeichendaten in einer Textdatei.

  • Haben Sie Leerzeichen in Spaltennamen oder Daten? Das read.table () Funktion können Räume in zum Beispiel Spaltennamen oder in String-Daten als Trennzeichen zu interpretieren. Sie erhalten dann Fehler, die Sie sagen, 'Line x hatte keine y Elemente'.

  • Haben Sie eine andere Dezimaltrennzeichens? In einigen Ländern sind die Dezimalstellen durch Komma getrennt. Sie müssen R speziell sagen, dass der Fall von dem Argument, dez = "," in dem read.table () Funktion.

  • Haben Sie vergessen, zu spezifizieren stringsAsFactors = FALSE? Standardmäßig ändert R Zeichendaten an Faktoren ab, so haben Sie immer dieses Argument hinzufügen, wenn Sie Ihre Daten wollen Zeichenvariablen zu bleiben.

  • Haben Sie einen anderen Weg, fehlende Werte zu spezifizieren? R liest 'N / A' in einer Textdatei als fehlenden Wert, aber die Datei einen anderen Code (zum Beispiel verwenden können, "Fehlenden"). R werden sehen, dass als Text und wieder diese Variable auf einen Faktor zu konvertieren. Sie lösen das durch das Argument Angabe na.strings in dem read.table () Funktion.

Wenn Sie immer die Struktur Ihrer Daten sofort überprüfen, nachdem Sie es eingelesen, können Sie Fehler viel früher fangen und Stunden der Frustration zu vermeiden. Ihre beste Wette ist zu verwenden, str () Informationen über die Arten und Kopf() wenn die Werte zu sehen sind, was Sie erwartet.

Menü