Daten in Long und Wide-Formate in R Verständnis

Wenn man über Gespräche in R Umformung Daten, ist es wichtig, Daten in langen und breiten Formaten zu erkennen. Diese visuellen Metaphern beschreiben zwei Möglichkeiten, die gleichen Informationen darstellen. Es ist hilfreich, diese Formate zu wissen, wann R. mit

Sie können durch die Tatsache, Daten im Wide-Format erkennen, dass Spalten repräsentieren Gruppen im Allgemeinen. So ist unser Beispiel für Basketball-Spiele im Wide-Format, weil es eine Spalte für die von jedem der Teilnehmer gemacht Körbe:

 Spielort Granny Geraldine Gertrude1 1. Brügge 12 5112 2. Gent 4 453 3. Gent 5 264 4. Brügge 6 47

Im Gegensatz dazu haben einen Blick auf das lange Format genau der gleichen Daten:

 Spielort Variable Wert1 1. Brügge Granny 122 2. Gent Granny 43 3. Gent Granny 54 4. Brügge Granny 65 1. Brügge Geraldine 56 2. Gent Geraldine 47 3. Gent Geraldine 28 4. Brügge Geraldine 49 1. Brügge Gertrude 1110 2. Gent Gertrude 511 3. Gent Gertrude 612 4. Brügge Gertrude 7

Beachten Sie, wie in der Langform, die drei Säulen für die Oma, Geraldine und Gertrude verschwunden sind. An ihrer Stelle haben Sie jetzt eine Spalte mit dem Namen Wert dass enthält die aktuelle Punktzahl und eine Spalte mit dem Namen Variable dass Links, die Partitur zu einem der drei Damen.

Wenn Daten zwischen langen und breiten Formaten konvertieren, ist es wichtig Kennung zu können Variablen von Messgrößen zu unterscheiden:

  • Identifier Variablen: Identifier oder ID, identifizieren Variablen die Beobachtungen. Denken Sie an diese als Schlüssel, die Ihre Beobachtungen identifiziert. (In Datenbank-Design, werden diese primären oder sekundären Schlüssel genannt.)

  • Messgrößen: Dies stellt die Messungen Sie beobachtet.

In unserem Beispiel sind die Identifizierer Variablen Spiel und Tagungsort, während die Meßgrößen sind die Ziele (das heißt, die Spalten Oma, Geraldine, und Gertrude).

Menü