Wie Kombinieren und Zusammenführen von Daten in R-Sets

Sie können Daten aus verschiedenen Quellen in Ihrer Analyse zu kombinieren. Im Allgemeinen können Sie R verwenden, um verschiedene Arten von Daten auf drei Arten kombinieren:

  • Durch die Zugabe von Spalten: Wenn die beiden Sätze von Daten eine gleiche Satz von Zeilen und die Reihenfolge der Reihen identisch ist, dann Hinzufügen von Spalten sinnvoll. Ihre Optionen, dies zu tun sind data.frame oder cbind ().

  • Durch Hinzufügen von Zeilen: Wenn beide Datensätze die gleichen Spalten und möchten Sie Reihen auf den Boden, die Verwendung hinzufügen rbind ().

  • Durch die Daten mit verschiedenen Formen kombiniert: Das verschmelzen() Funktion kombiniert Daten auf der Grundlage gemeinsamer Spalten sowie gemeinsame Reihen. In Datenbanken Sprache wird dies in der Regel genannt Verbindungsdaten.

Sie nutzen verschmelzen() die Kreuzung sowie die Vereinigung von verschiedenen Datensätzen zu finden. Sie auch einen Blick auf andere Wege der Zusammenarbeit mit Lookup-Tabellen arbeiten, mit den Funktionen Spiel() und %im%.

bild0.jpg

Manchmal möchten Sie Daten zu kombinieren, wo es nicht so einfach ist, einfach Spalten oder Zeilen hinzufügen. Es könnte sein, dass Sie die Daten auf der Grundlage der Werte kombinieren wollen der Schlüssel in den Daten bereits existierenden. Hier wird der verschmelzen() Funktion ist nützlich. Sie können verwenden verschmelzen() nur zu kombinieren Daten, wenn bestimmte Anpassungsbedingungen erfüllt sind.

Nehmen wir zum Beispiel haben Sie Informationen über Zustände in einem Land. Wenn ein Datensatz Informationen über die Bevölkerung und in einem anderen Informationen über Regionen, und beide haben Informationen über den Zustand Namen, können Sie verschmelzen() kombinieren Sie Ihre Ergebnisse.

Menü