Wie man eine Datenstruktur in R Bestimmen

Die erste Entscheidung, die Sie treffen müssen, bevor Sie Ihre Daten zu analysieren, wie diese Daten innerhalb R. darstellen Wenn Ihre Daten nur eine Dimension hat, dann wissen Sie bereits, dass die Vektoren sehr gut diese Art von Daten darstellen. Allerdings, wenn Ihre Daten mehr als eine Dimension hat, haben Sie die Wahl der Verwendung von Matrizen, Listen oder Datenrahmen. Also, die Frage ist: Wann verwendet man das?

Matrices und höherdimensionalen Arrays sind nützlich, wenn alle Ihre Daten von einer einzigen Klasse sind - mit anderen Worten, alle Ihre Daten sind numerisch oder alle Ihre Daten sind Zeichen. Wenn Sie einen Mathematiker oder Statistiker sind, sind Sie mit Matrizen vertraut und verwenden Sie wahrscheinlich diese Art von Objekt sehr häufig.

Aber in vielen praktischen Situationen, werden Sie Daten haben, die viele verschiedene Klassen haben - mit anderen Worten, haben Sie eine Mischung aus numerischen und Zeichendaten. In diesem Fall müssen Sie entweder Listen oder Datenrahmen zu verwenden.

Wenn Sie Ihre Daten als eine einzelne Tabellen vorstellen, ist ein Datenrahmen wahrscheinlich eine gute Wahl. Denken Sie daran, dass ein Datenrahmen ist einfach eine Liste von Namen Vektoren der gleichen Länge, die in eine Tabelle mit Spalten und eine Spaltenüberschrift für jede konzeptionell sehr ähnlich ist.

Wenn Sie mit Datenbanken vertraut sind, können Sie einen Datenrahmen denken ähnlich wie in einer einzigen Tabelle in einer Datenbank. Datenrahmen sind enorm nützlich und in vielen Fällen wird Ihre erste Wahl der Objekte werden für die Speicherung Ihrer Daten.

Wenn Ihre Daten aus einer Sammlung von Objekten besteht, aber Sie können nicht, dass als ein Array oder einem Datenrahmen darstellen, dann eine Liste ist Ihre ideale Wahl. Da listet alle möglichen anderen Objekte enthalten, einschließlich anderer Listen oder Datenrahmen, sind sie enorm flexibel. Folglich weist R eine Vielzahl von Werkzeugen Listen zu bearbeiten.

Sie können feststellen, dass ein Datenrahmen eine sehr geeignete Wahl für die meisten Analysen und Datenverarbeitungsaufgaben ist. Es ist eine sehr bequeme Möglichkeit, Ihre Daten zu repräsentieren, und es ist ähnlich wie mit Datenbanktabellen arbeiten. Wenn Sie Daten aus einer durch Komma getrennten Wert lesen (CSV) mit der Funktion Datei read.csv () oder read.table (), R stellt die Ergebnisse in einem Datenrahmen.

ObjektBeschreibungBemerkungen
VektorDie grundlegende Datenobjekt in R, bestehend aus einem oder mehreren Werten auseiner einzigen Typ (zum Beispiel Zeichen, eine Zahl oder Integer).Betrachten Sie das als eine einzelne Spalte oder Zeile in einer Tabelle oder acolumn in einer Datenbanktabelle.
Matrix oder ArrayEin mehrdimensionales Objekt aus einer einzigen Art (bekannt alsatomar). Eine Matrix ist ein Array von zwei Dimensionen.Wenn Sie Nummern speichern in vielen Dimensionen, usearrays.
ListeListen können Objekte jeglicher Art enthalten.Listen sind sehr nützlich für die zusammen Sammlungen von Daten thatbelong speichern. Weil Listen Listen enthalten kann, ist diese Art ofobject ist sehr nützlich.
data.frameDatenrahmen sind eine besondere Art von benannte Liste, in der alle theelements die gleiche Länge haben.Datenrahmen sind ähnlich zu einer einzigen Tabelle oder zu einer tablein einer Datenbank.

Menü