Wie Hinzufügen von Variablen zu einem Datenrahmen in R

Ein Datenrahmen kann mit neuen Variablen in R. Sie kann verlängert werden, beispielsweise das Team von Daten von einem anderen Spieler auf Granny bekommen. Oder Sie können eine neue Variable von den anderen Variablen im Datensatz, wie die Gesamtsumme der Körbe in jedem Spiel gemacht berechnet werden soll.

Menu

Hinzufügen einer einzigen Variablen

Es gibt drei Möglichkeiten, eine Variable hinzufügen. Ähnlich wie im Fall von Beobachtungen hinzufügen, können Sie entweder die cbind () Funktion oder die Indizes.

Sie können auch die Dollar-Zeichen verwenden, um eine zusätzliche Variable hinzuzufügen. Stellen Sie sich vor, dass Granny Sie die Anzahl der Körbe ihrer Freundin Gabrielle zu den Datenrahmen hinzuzufügen gefragt. Erstens würde man einen Vektor mit diesen Daten wie folgt zu erstellen:

> baskets.of.Gabrielle lt; - c (11, 5, 6, 7, 3, 12, 4, 5, 9)

Um eine zusätzliche Variable erstellen benannt Gabrielle mit, dass Daten, tun Sie einfach folgendes:

> Baskets.df $ Gabrielle lt; - baskets.of.Gabrielle

Wenn Sie, ob dies funktioniert überprüfen möchten, aber Sie wollen nicht den gesamten Datenrahmen angezeigt werden, können Sie die verwenden Kopf() Funktion. Diese Funktion nimmt zwei Argumente: das Objekt, das Sie anzeigen möchten, und die Anzahl der Zeilen, die Sie sehen wollen. Um die ersten vier Zeilen des neuen Datenrahmens, baskets.df, Verwenden Sie den folgenden Code:

> Kopf (baskets.df, 4) Granny Geraldine Gabrielle1st 12 5112. 4 4 53rd 5 2 6 4 7 64.

Hinzufügen mehrerer Variablen cbind

Sie können Ihre Datenrahmen ist eine Matrix vorgeben und verwenden Sie die cbind () Funktion, dies zu tun. Anders als bei der Verwendung rbind () auf Datenrahmen, brauchen Sie nicht einmal über die Zeilen- oder Spaltennamen zu kümmern. Lassen Sie uns mit den Zielen für Gertrude und Guinevere einen neuen Datenrahmen erstellen. Um sowohl in einem Datenrahmen kombinieren, versuchen Sie:

> new.df lt; - data.frame (+ Gertrud = c (3, 5, 2, 1, NA, 3, 1, 1, 4), + Guineveres = c (6, 9, 7, 3, 3, 6, 2, 10, 6) +)

Obwohl die Zeilennamen der Datenrahmen new.df und baskets.df abweichen, wird R dies ignorieren und nur die Zeile Namen des ersten Datenrahmens in den Einsatz cbind () Funktion, wie Sie aus dem Ausgang des folgenden Codes zu sehen:

> Kopf (cbind (baskets.df, new.df), 4) Granny Geraldine Gabrielle Gertrude Guinevere1st 12 5113 62. 4 4 55 93. 5 2 62 74. 6 4 71 3

Wenn ein Datenrahmen oder eine Matrix mit Spaltennamen verwenden, werden R jene, die als die Namen der Variablen verwenden. Wenn du benutzt cbind () einen Vektor zu einem Datenrahmen hinzuzufügen, wird R der Vektor Namen als Variablennamen verwenden, wenn Sie ein selbst festlegen, wie Sie mit tat rbind ().

Wenn Sie eine Matrix ohne Spaltennamen in den Datenrahmen binden, verwendet R automatisch die Spaltennummern als Namen. Das wird ein wenig Mühe verursachen aber, weil reine Nummern sind ungültige Objektnamen und daher schwieriger als Variablennamen zu verwenden. In diesem Fall sollten Sie besser die Indizes verwenden.

Wann immer Sie wollen einen Datenrahmen zu verwenden, und wollen nicht ständig haben ihren Namen zu geben, gefolgt von $, Sie können die Funktionen nutzen mit() und innerhalb(). Mit dem innerhalb() Funktion, können Sie auch einfach Variablen zu einem Datenrahmen hinzufügen.

Menü