Wie zu den Faktoren oder numerische Daten in R Verwenden

Bevor Sie versuchen, Ihre Daten in R zu beschreiben, müssen Sie Ihre Daten sicher im richtigen Format ist. Das heisst

  • Sicherstellen, dass alle Ihre Daten werden in einem Datenrahmen (oder in einem Vektor, wenn es eine einzelne Variable) enthalten

  • Um sicherzustellen, dass alle Variablen des richtigen Typs sind

  • Überprüfen, ob die Werte korrekt alle verarbeitet werden

Einige Daten können nur eine begrenzte Anzahl unterschiedlicher Werte haben. entweder männlich oder weiblich Menschen können zum Beispiel sein, und Sie können die meisten Haartypen mit nur wenigen Farben beschreiben.

Manchmal sind mehrere Werte theoretisch möglich, aber nicht realistisch. Zum Beispiel können Autos haben mehr als 16 Zylinder in ihren Motoren, aber Sie werden nicht viele von ihnen finden. In der einen oder anderen, können alle diese Daten als gesehen werden, kategorisch. Durch diese Definition umfasst kategorische Daten auch ordinale Daten.

Auf der anderen Seite haben Sie Daten, die eine unbegrenzte Anzahl von möglichen Werten haben kann. Dies bedeutet nicht notwendigerweise, dass die Werte einen beliebigen Wert sein, die Sie mögen. Wird beispielsweise die Kilometerleistung eines Fahrzeugs in Meilen pro Gallone, die oft auf die ganze Meile gerundet. Dennoch wird der reale Wert für jedes Auto etwas anders sein.

Das einzige, was die definiert, wie viele mögliche Werte, die Sie erlauben, ist die Präzision, mit der Sie die Daten zum Ausdruck bringen. Daten, die mit jedem beliebigen Grad an Präzision ausgedrückt werden kann, ist kontinuierlich. Beide Intervall skalierten Daten und das Verhältnis skalierten Daten sind in der Regel kontinuierlich Daten.

Die Unterscheidung zwischen kategorischen und kontinuierlichen Daten ist jedoch nicht immer klar. Das Alter ist im Wesentlichen eine kontinuierliche Variable, aber es ist oft in der Anzahl der Jahre seit der Geburt zum Ausdruck gebracht.

Sie haben noch eine Menge der möglichen Werte, wenn Sie das tun, aber was passiert, wenn man im Alter der Kinder bei Ihrem örtlichen High-School aus? Plötzlich haben Sie nur fünf, vielleicht sechs, verschiedene Werte in Ihren Daten. An diesem Punkt können Sie mehr aus Ihrer Analyse, wenn man die Daten als kategorische behandeln.

Wenn Sie Ihre Daten zu beschreiben, müssen Sie den Unterschied zwischen Daten zu machen, die von Nutzen zu einem Faktor und Daten umgewandelt werden, die numerische bleiben muss. Wenn Sie Ihre Daten als kategorische sehen kann, ist es zu einem Faktor Umwandlung hilft bei der es zu analysieren.

Menü