Wie zu verwenden, um Daten in Hochformat in Lattice Stücke in R

Wenn Sie Daten in Hochformat in R haben, können Sie ganz einfach nutzen Gitter Grafiken Untergruppen in Ihre Daten zu visualisieren. Zum Beispiel, was passiert, wenn man mehr als eine Variable gleichzeitig analysieren möchten?

Betrachten Sie die Einbau-Dataset longley, enthält Daten über die Beschäftigung, Arbeitslosigkeit und anderen Bevölkerungsindikatoren:

> Str (Longley) 'data.frame': 16 obs. von 7 Variablen: $ GNP.deflator: num 83 88,5 88,2 89,5 96,2 ... $ GNP: num 234 259 258 285 329 ... $ Arbeitslos: num 236 232 368 335 210 ... $ Armed.Forces: num 159 146 162 165 310 ... $ Bevölkerung: num 108 109 110 111 112 ... $ Jahr: int 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 ... Beschäftigt $: num 60,3 61,1 60,2 61,2 63,2 ...

Eine Möglichkeit, auf einfache Weise die verschiedenen Variablen eines Datenrahmens zu analysieren ist, zuerst den Datenrahmen von Breitformat zu Hochformat neu zu gestalten.

Eine breite Datenrahmen enthält eine Spalte für jede Variable. Ein großer Datenrahmen enthält die gleichen Informationen, aber die Daten werden so organisiert, daß eine Spalte zur Identifizierung des Namens der Variable reserviert ist und eine zweite Spalte enthält die eigentlichen Daten.

Eine einfache Möglichkeit, einen Datenrahmen von Breitformat zu Hochformat neu zu gestalten ist das zu verwenden, Schmelze() Funktion in der reshape2 Paket. Merken: reshape2 Teil der Basis R nicht - es ist ein Add-on-Paket, das auf CRAN zur Verfügung steht. Sie können es mit der Installation install.packages ( "reshape2") Funktion.

> Bibliothek ( "reshape2")> mlongley lt; - Schmelze (Longley, id.vars = "Jahr")> str (mlongley) 'data.frame': 96 obs. von 3 Variablen: $ Jahr: int 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 ... $ variable: Faktor w / 6 Ebenen "GNP.deflator", ..: 1 1 1 1 1 1 1 1 1 1 .. . $ value: num 83 88,5 88,2 89,5 96,2 ...

Jetzt können Sie die hohen Datenrahmen plotten mlongley und nutzen Sie die neuen Spalten Wert und Variable in der Formel Wert ~ Jahr | Variable.

> Xyplot (Wert ~ Jahr | Variable, data = mlongley, + layout = c (6, 1), + par.strip.text = list (CEX = 0,7), + Waage = list (CEX = 0,7) +)

Die zusätzlichen Argumente par.strip.text und Waage kontrollieren Sie die Schriftgröße (Zeichenexpansionsverhältnis) des Streifens an der Spitze der Tabelle, sowie die Skala.

Wenn Sie Diagramme mit mehreren Gruppen zu erstellen, stellen Sie sicher, dass die resultierende Handlung sinnvoll ist. Zum Beispiel kann die Einheit des BSP (kurz für Bruttosozialprodukt) Ist wahrscheinlich Milliarden von Dollar. Im Gegensatz der Bevölkerung ist das Gerät wahrscheinlich Millionen von Menschen. (Die Dokumentation der longley Daten-Set ist zu diesem Thema nicht klar.)

Seien Sie sehr vorsichtig, wenn Sie Plots wie diese präsentieren - Sie müssen nicht beschuldigt werden wollen schaffen Chart-Junk (Irreführende Grafiken).

bild0.jpg

Menü