Wie Extrahieren von Variablen, Beobachtungen und Werte aus einem Datenrahmen in R

In vielen Fällen können Sie Werte aus einem Datenrahmen R extrahieren, indem er vorgibt, dass es sich um eine Matrix ist. Aber obwohl Datenrahmen wie Matrizen aussehen, sie sind definitiv nicht. Anders als Matrizen und Arrays, Datenrahmen sind intern nicht als Vektoren gespeichert, sondern als Listen von Vektoren.

Menu

So zu tun, es ist eine Matrix

Wenn Sie von einem Datenrahmen Werte extrahieren möchten, können Sie einfach so tun, als es sich um eine Matrix ist und von dort aus starten. Sie können die Indexnummern, Namen oder logische Vektoren für die Auswahl, wie Sie es mit Matrizen verwenden. Zum Beispiel können Sie die Anzahl der Körbe Tor von Geraldine im dritten Spiel wie diese:

> Baskets.df [# 147-3rd # 148-, # 147-Geraldine # 148 -] [1] 2

Ebenso können Sie alle Körbe bekommen, die Oma den Spaltenindex erzielte verwenden, wie folgt aus:

> Baskets.df [1] [1] 12 4 5 6 9 3

Oder, wenn Sie dies einen Datenrahmen sein wollen, können Sie das Argument Tropfen = FALSE genau wie Sie mit Matrizen:

> Str (baskets.df [, 1, Tropfen = FALSE]) 'data.frame': 6 obs. von 1 Variable: $ Granny: num 12 4 5 6 9 3

Beachten Sie, dass im Gegensatz zu mit Matrizen, die Zeilen Namen fallen gelassen werden, wenn Sie die nicht angeben Tropfen = FALSE Streit.

Setzen Sie Ihre Dollar, wo Ihre Daten

Als aufmerksamer Leser bemerkt, dass Sie bereits, dass jede Variable ein Dollarzeichen vorangestellt ist ($) In der Ausgabe von str (). R ist nicht unbedingt Ihre Daten hier Zuhälterei - das Dollarzeichen ist einfach eine bestimmte Art und Weise Variablen für den Zugriff. Für den Zugriff auf die Variable Oma, Sie können das Dollarzeichen wie folgt verwenden:

> Baskets.df $ Granny [1] 12 4 5 6 9 3

So legen Sie den Datenrahmen, die von einem Dollarzeichen gefolgt und dann den Namen der Variablen. Sie müssen nicht den Variablennamen durch Anführungszeichen setzen (wie würden Sie, wenn Sie die Indizes verwenden). R einen Vektor mit allen Werten zurückgeben, die in dieser Variablen enthalten sind. Beachten Sie wieder, dass die Zeilennamen werden hier fallen gelassen.

Mit diesem Dollar-Zeichen-Methode können Sie nur eine Variable zu einem Zeitpunkt zugreifen. Wenn Sie mehrere Variablen auf einmal mit ihren Namen zugreifen möchten, müssen Sie die eckigen Klammern zu verwenden.

Menü