Wie Unterscheiden Datentypen in R

Auf dem Gebiet der Statistik, zwischen Variablen von verschiedenen Typen zu unterscheiden in der Lage ist, sehr wichtig. Die Art der Daten bestimmt, sehr oft die Art der Analyse, die durchgeführt werden können. Als Ergebnis bietet die Möglichkeit, Daten R explizit wie folgt klassifizieren:

  • Nenndaten: Diese Art von Daten, die Sie in R repräsentieren Faktoren, unterscheidet zwischen verschiedenen Kategorien, aber es gibt keine implizite Ordnung zwischen den Kategorien. Beispiele für nominale Daten sind Farben (rot, grün, blau), Geschlecht (männlich, weiblich), und Nationalität (British, Französisch, Japanisch).

  • Ordinal Daten: Ordinal datais zeichnet sich dadurch aus, dass es irgendeine Art von natürlichen Ordnung zwischen den Elementen ist aber kein Hinweis auf die relative Größenunterschied. Jede Art von Daten, die möglich ist, um zu ordnen, aber nicht exakte Werte geben ist ordinal. Beispielsweise, niedrig lt; Mittel lt; hoch beschreibt Daten, die mit drei Ebenen bestellt wird.

    In der Marktforschung, ist es sehr üblich, einen Fünf-Punkte-Skala zu verwenden, Wahrnehmungen zu messen: entschieden widersprechen lt; nicht zustimmen lt; neutral lt; zustimmen lt; stark zustimmen. Dies ist auch ein Beispiel für Ordnungsdaten.

    Ein weiteres Beispiel ist die Verwendung der Namen von Farben anzuzeigen, um, wie rot lt; Bernstein lt; grün um anzuzeigen, den Projektstatus.

    In R, die Sie verwenden bestellt Faktoren Ordnungsdaten zu beschreiben.

  • Numerische Daten: Sie haben numerische Daten, wenn Sie Ihre Daten mit Zahlen (zum Beispiel Länge, Gewicht oder Anzahl) beschreiben kann. Numerische Daten hat zwei Unterkategorien.

  • Interval skalierten Daten: Sie haben Intervalldaten skaliert, wenn das Intervall zwischen benachbarten Messeinheiten gleich ist, aber der Nullpunkt willkürlich. Ein alltägliches Beispiel für Intervall skalierten Daten ist unser Kalendersystem. Jedes Jahr hat die gleiche Länge, aber der Nullpunkt willkürlich. Mit anderen Worten, die Startzeit im Jahr nicht Null -einfach eine bequeme Jahr nutzen zu zählen beginnen. Das heißt, Sie addieren und subtrahieren Termine (und alle anderen Arten von Intervall skalierten Daten), aber man kann nicht sinnvoll Daten teilen. Weitere Beispiele sind Länge, sowie alles andere, wo es Uneinigkeit darüber sein kann, wo der Ausgangspunkt ist.

    Weitere Beispiele für Intervall skalierten Daten können in der sozialwissenschaftlichen Forschung wie Marktforschung zu finden.

    In R können Sie verwenden ganze Zahl oder numerisch Objekte Intervall skalierten Daten darzustellen.

  • Verhältnis skalierten Daten: Dies sind Daten, wo alle Arten von mathematischen Operationen erlaubt sind, insbesondere die Fähigkeit und die Kluft zu multiplizieren (mit anderen Worten, nehmen Verhältnisse). Die meisten Daten in physikalischen Wissenschaften sind Verhältnis skaliert - zum Beispiel Länge, Masse und Geschwindigkeit. In R, die Sie verwenden numerisch Objekte Verhältnis skalierten Daten darzustellen.

Menü