Wie Verwenden von Datentabellen in R

Ein erster Schritt in jeder Analyse, unter Verwendung von R oder nicht, besteht darin, die deskriptiven Statistiken für Ihre Daten-Set zu berechnen. Sie müssen erhalten die Daten zu wissen, die Sie erhalten haben, bevor Sie genau entscheiden können, welche Modelle Sie sie ausprobieren.

Menu

Sie müssen etwas über den Bereich der Werte in Ihren Daten zu wissen, wie diese Werte im Bereich verteilt sind, und wie die Werte in verschiedenen Variablen zueinander in Beziehung stehen. Vieles von dem, was Sie tun und wie Sie tun, hängt es von der Art der Daten.

Jedes Mal, wenn Sie nur eine begrenzte Anzahl verschiedener Werte haben, können Sie eine kurze Zusammenfassung der Daten erhalten, indem eine Berechnung Häufigkeitstabelle. Ein Frequenztabelle ist eine Tabelle, die die Anzahl des Auftretens von jedem eindeutigen Wert in der Variablen darstellt. In R, verwenden Sie die Tabelle() Funktion dafür.

Wie eine Datentabelle in R zu erstellen

Sie können tabellarisch zum Beispiel die Menge der Autos mit einem manuellen und einem automatischen Getriebe mit dem folgenden Befehl:

> amtable lt; - Tabelle (Autos $ Uhr)> amtableauto manual13 19

Dieses Ergebnis sagt Ihnen, dass, in den Daten gibt es 13 Autos mit Automatikgetriebe und 19 mit einem Schaltgetriebe.

Wie mit Datentabelle in R zu arbeiten,

Wie bei den meisten Funktionen können Sie die Ausgabe sparen Tabelle() in einem neuen Objekt (in diesem Fall bezeichnet amtable). Auf den ersten Blick der Ausgang Tabelle() einer benannten Vektor aussieht, aber ist es?

> Klasse (amtable) [1] "table"

Das Tabelle() Funktion erzeugt ein Objekt der Klasse Tabelle. Diese Objekte haben die gleiche Struktur wie ein Array. Arrays können eine beliebige Anzahl von Dimensionen und Dimensions Namen haben. Tabellen können als Arrays behandelt werden, um Werte oder Dimensionsnamen zu wählen.

Menü