Wie ein Datensatz in R zu Summarize

Wenn Sie einen schnellen Überblick über Ihre Daten-Set benötigen, können Sie sich natürlich immer die R-Befehl str ()

und Blick auf die Struktur. Aber das sagt etwas nur über die Klassen Ihrer Variablen und die Anzahl der Beobachtungen. Auch die Funktion Kopf() gibt Ihnen, im besten Fall, die Daten im Datensatz eine Vorstellung von der Art und Weise gespeichert ist.

Wie die Ausgabe zu erhalten

Um eine bessere Vorstellung von der Verteilung Ihrer Variablen im Datensatz zu erhalten, können Sie mit dem Zusammenfassung() funktioniert wie folgt aus:

> Zusammenfassung (Autos) mpg Zyl am gearMin. : 10,40 Min. : 4.000 auto: 13 3: 151. Qu.:15.43 1. Qu.:4.000 Handbuch: 19 4: 12Median: 19,20 Median: 6,0005: 5Mean: 20,09 Mittelwert: 6.1883rd Qu.:22.80 3. Qu.:8.000Max. : 33.90 Max. : 8.000

Das Zusammenfassung() Funktion funktioniert am besten, wenn Sie nur R verwenden interaktiv auf der Kommandozeile für das Dataset schnell zu scannen. Sie sollten nicht versuchen, es innerhalb einer benutzerdefinierten Funktion nutzen zu können, selbst geschrieben.

Der Ausgang des Zusammenfassung() Funktion zeigt Ihnen für jede Variable eine Reihe von deskriptiven Statistiken, je nach Art der Variablen:

  • Numerische Variablen: Zusammenfassung() gibt Ihnen die Reichweite, Quartile, Median, und bedeuten.

  • Faktor Variablen: Zusammenfassung() eine Tabelle gibt Ihnen mit Frequenzen.

  • Numerische und Faktorvariablen: Zusammenfassung() wenn es gibt Ihnen die Anzahl der fehlenden Werte, sind vorhanden.

  • Zeichengrößen: Zusammenfassung() nicht geben Ihnen keine Informationen überhaupt abgesehen von der Länge und der Klasse (die 'Charakter').

Wie ein Problem zu beheben

Haben Sie die seltsame Werte für die Variable Zyl? Ein kurzer Blick auf die Zusammenfassung kann Ihnen sagen, es ist etwas faul geht, wie zum Beispiel das Minimum und das erste Quartil haben genau den gleichen Wert. Tatsächlich wird die Variable Zyl nur drei Werte hat und würde besser dran als ein Faktor sein. Also, lassen Sie uns diese Variable setzen aus ihrem Elend:

> Autos $ Zyl lt; - as.factor (Autos $ Zyl)

Menü