Grundlagen der Datentypen und Strukturen in R-Programmierung für Predictive Analytics

In R-Programmierung für Predictive Analytics, Data Arten

manchmal mit Daten verwechselt Strukturen. Jede Variable in dem Programmspeicher hat einen Datentyp. Natürlich können Sie mit mit mehreren Variablen in Ihrem Programm weg und noch überschaubar sein. Aber das wird wahrscheinlich nicht so gut funktionieren, wenn Sie hunderte (oder tausende) von Variablen- Sie haben jede Variable einen Namen zu geben, so dass Sie darauf zugreifen können.

Es ist effizienter all diese Variablen in einer logischen Sammlung zu speichern.

Datentypen

Wie andere vollwertige Programmiersprachen, bietet R viele Datentypen und Datenstrukturen. Es besteht keine Notwendigkeit, den Typ zu spezifizieren, die Sie zu einem nicht fest Zuordnung sind die Dolmetscher, dass für Sie tun. Sie können jedoch die Art, wenn die Notwendigkeit arises- dies angeben oder konvertieren genannt wird Guss. Drei Datentypen sind wie folgt:

  • Numerische: Dies sind typische Dezimalzahlen. Diese werden als Schwimmer (kurz für Gleitkommazahlen) oder Doppel in anderen Sprachen.

  • Figuren: Dies sind die Saiten gebildet mit Kombinationen aus Buchstaben, Zeichen und Ziffern bestehen. Sie sind keine numerische Bedeutung haben soll. Diese werden als Streicher in anderen Sprachen.

  • Logisch: WAHR oder FALSCH. Kapital immer diese Werte in R. Diese Werte werden genannt Booleans in anderen Sprachen.

Vergleicht man eine Reihe von Zahlen zu einer numerischen Zahl ergibt sich der Interpreter die Zahlenfolge in eine numerische Umwandlung und dann einen numerischen Vergleich zu tun.

Beispiele für Datentypen sind wie folgt:

> i lt; - 10 # numeric> j lt; - 10,0 # numeric> k lt; - "10" # Zeichen> m lt; - i == j # logische> n lt; - i == k # logische

Nachdem Sie diese Zeilen Code ausführen, können Sie ihre Werte und Typen herausfinden, indem die Verwendung von str () Funktion. Dieser Vorgang sieht wie folgt aus:

> Str (i) num 10> str (j) num 10> str (k) chr "10"> str (m) logi TRUE> str (n) logi WAHR

Der Ausdruck in der n Zuordnung ist ein Beispiel für den Interpreter vorübergehend Umwandlung der Datentyp k in eine numerische die Auswertung zwischen numerischen zu tun ich und Charakter k.

Datenstrukturen

R einen Platz zum Speichern von Gruppen von Datentypen, mit denen diese müssen effizient zu arbeiten. Diese werden als Datenstrukturen.

Ein Beispiel aus der Praxis dieses Konzepts ist ein Parkhaus: Es ist eine Struktur, die Autos effizient speichert. Es ist so konzipiert, so viele Autos wie möglich zu parken, und ermöglicht für Automobile effizient eingeben und die Struktur verlassen. keine anderen Objekte außer Autos sollten auch in einem Parkhaus abgestellt werden.

Datenstrukturen sind:

  • Vektoren: Vektoren speichern eine Reihe von Werten eines einzigen Datentyp. Betrachten Sie es als eine wöchentliche Pillbox. Jedes Fach im Pillbox kann nur eine bestimmte Art von Objekt speichern. Nachdem Sie ein paar Pillen setzen in einem der Fächer, alle anderen Fächer auch mit entweder Null Pillen oder mehr Pillen gefüllt werden müssen.

    Sie können keine Münzen setzen in der gleichen Box- Sie haben eine andere zu verwenden, # 147-pill box # 148- (Vektor) dafür. Ebenso, wenn Sie eine Nummer in einem Vektor speichern, werden alle zukünftigen Werte sollten auch Zahlen sein. Andernfalls wird der Interpreter konvertiert alle Zahlen in Zeichen um.

  • Matrices: EIN Matrix sieht aus wie eine Excel-Tabelle: es ist eine Tabelle mit Zeilen und Spalten im Wesentlichen aus. Die Daten füllt die leeren Zellen von Zeile oder Spalte, in welcher Reihenfolge Sie angeben, wenn Sie die Matrix erstellen.

    Alle Spalten müssen denselben Datentyp haben.

  • Datenrahmen: Ein Datenrahmen ist ähnlich einer Matrix, mit der Ausnahme eines Datenrahmens Spalten unterschiedliche Datentypen enthalten kann. Die Datensätze in prädiktive Modellierung verwendet werden, in Datenrahmen geladen und dort in dem Modell für die Verwendung gespeichert.

  • Faktoren: EIN Faktor ist wie ein Vektor mit einer begrenzten Anzahl von unterschiedlichen Werten. Die Anzahl der unterschiedlichen Werte wird als ihre Ebene. Sie können Faktoren verwenden, um eine Spalte zu behandeln, die eine begrenzte und bekannte Anzahl von Werten als kategorische Werte hat. Standardmäßig ist die Zeichendaten in Datenrahmen als Faktoren geladen.

Sie greifen auf Vektoren, Matrizen und Datenrahmen durch die Verwendung Array-Notation. Zum Beispiel würden Sie eingeben v [5] das fünfte Element des Vektors zuzugreifen v. Für eine zweidimensionale Matrix und Datenrahmen, setzen Sie in der Zeilennummer und Spaltennummer, durch ein Komma getrennt, in den eckigen Klammern. Zum Beispiel, geben Sie m [2,3] die zweite Zeile, dritte Spalte Wert für Matrix zuzugreifen m.

Datenstrukturen sind ein fortgeschrittenes Thema in der Informatik. Denn jetzt sind halten wir an dem praktisch. Denken Sie daran, dass Datenstrukturen wurden bestimmte Arten von Daten zu speichern, gebaut und sie haben Funktionen für die Daten Einfügen, Löschen und Wiederherstellung.

Menü