Grundlagen der R-Programmierung für Predictive Analytics

R ist eine Programmiersprache, die ursprünglich für Statistiker geschrieben statistische Analyse zu tun, einschließlich Predictive Analytics. Es ist Open-Source-Software, umfangreich in der Wissenschaft eingesetzt, um solche Disziplinen wie Statistik, Bio-Informatik und Wirtschaftswissenschaften lehren. Von seinen bescheidenen Anfängen hat es seit erweitert Datenmodellierung, Data Mining und prädiktive Analyse zu tun.

R hat eine sehr aktive gemeindefreie Code-Beiträge werden ständig und konsequent gemacht. Einer der Vorteile eines Open-Source-Tool wie R ist, dass die meisten der Datenanalyse, die Sie bereits von jemand getan wurde tun wollen werde. Codebeispiele werden auf vielen Foren und von Universitäten geschrieben.

Wenn Sie mit etwas problematischen Code stecken, schreiben Sie einfach eine Frage auf einem Forum (wie Stack-Austausch oder Stack-Überlauf) und Sie erhalten eine Antwort in kürzester Zeit.

Da R frei zu verwenden ist, ist es das perfekte Werkzeug verwenden, um einen schnellen Prototyp zu bauen Management von Predictive Analytics, die Vorteile zu zeigen. Sie müssen nicht das Management fragen etwas zu kaufen, um sofort zu beginnen. Jeder Ihrer Daten Wissenschaftler, Business-Analysten, Statistiker oder Software-Ingenieure können ohne weitere Investitionen in die Software den Prototyp tun.

Daher kann R eine kostengünstige Möglichkeit, mit Predictive Analytics zu experimentieren, ohne Enterprise-Software kaufen zu müssen. Nachdem Sie beweisen, dass Predictive Analytics hinzufügen können (oder ist das Hinzufügen) Wert, sollten Sie in der Lage sein Management zu überzeugen, bekommen ein handelsüblichem Werkzeug für Ihre frisch gebackenen Daten-Wissenschaftsteam zu berücksichtigen.

Wie zu installieren R

R Installation ist ein einfacher Vorgang, der weniger als 30 Minuten dauert. Die meisten der Standardeinstellungen können während des Installationsprozesses akzeptiert werden. Sie können R installieren, indem Sie das Installationsprogramm für Windows und andere Betriebssysteme aus dem Download R Website.

Nachdem Sie die R Website zu erhalten, können Sie sich für den Download Link um die Datei zu erhalten. Nachdem Sie die Datei heruntergeladen haben, doppelklicken Sie einfach auf den Installationsvorgang zu starten.

Wie installiert man RStudio

Nachdem Sie die R Installationsvorgang abgeschlossen haben, können Sie RStudio installieren. die RStudio IDE Installation ist genauso einfach wie R. Installation Sie RStudio Desktop herunterladen können von ihren Webseite. Sie wollen die Desktop-Version für Ihr Betriebssystem zu installieren (zum Beispiel RStudio Version 0.97.551 für Windows). Nachdem Sie die Datei heruntergeladen haben, doppelklicken Sie einfach auf den Installationsvorgang zu starten.

Hier ist eine direkte Verbindung für Ihre Bequemlichkeit.

Grundlagen der R-Umgebung

RStudio ist eine grafische Benutzeroberfläche für die R-Programme zu entwickeln. Die Standard-Schnittstelle (die Art, wie es aussieht, wenn Sie zum ersten Mal das Programm starten) vier Fensterscheiben. Sie werden alle vier von ihnen häufig verwenden.

bild0.jpg

  • Der obere linke Fenster ist das Skript-Fenster.

    Hier können Sie R-Code kopieren und einfügen können. Sie können, indem sie die Zeilen, die Sie möchten, führen Sie den Code-Zeile-für-Zeile oder in Blöcken laufen. Das Skript-Fenster ist auch, wo Sie die Werte von Datenrahmen anzeigen können. Wenn Sie einen Datenrahmen aus dem Arbeitsbereich klicken, wird es einen neuen Eintrag im Skript-Fensterbereich mit den Datenrahmen Werte öffnen.

  • Der untere linke Fenster ist Ihr Konsolenfenster.

    Hier können Sie Ihre R-Code für eine Zeile zu einem Zeitpunkt geben. Der Ausgang (falls vorhanden) wird in der nächsten Zeile gedruckt direkt nach der Ausführung des Befehls beendet hat.

  • Die obere rechte Fenster ist Ihr Arbeitsbereich und Geschichte Fenster.

    Es verfügt über zwei Registerkarten:

  • Die Registerkarte Verlauf speichert die Geschichte aller Code, den Sie in der aktuellen Sitzung ausgeführt haben.

  • Die Registerkarte Arbeitsbereich listet alle Variablen im Speicher. Hier können Sie die Variablen klicken, um ihre Werte zu sehen und (wenn Sie so wählen) Last Datensätze interaktiv.

  • Das untere rechte Fenster, wo Sie vier Registerkarten von Interesse finden:

  • Eine Registerkarte Hilfe bietet Dokumentation wie Beschreibungen von Funktionen.

  • Die Registerkarte Pakete zeigt alle Pakete installiert und von Ihrem Programm zu laden. Die ausgewählten Pakete sind diejenigen, die geladen wurden für das Programm verwendet werden. Sie können neue Pakete hier zu suchen und zu installieren.

  • Die Plots Registerkarte wird die Ausgabe aller Plots angezeigt.

  • Die Registerkarte Dateien ist Ihre Datei-Explorer innerhalb RStudio.

  • Menü