Verschiedene Ansätze zu Big Data Analysis

In vielen Fällen werden große Datenanalyse für den Endbenutzer durch Berichte und Visualisierungen dargestellt werden. Da die Rohdaten unbegreiflich variiert werden kann, müssen Sie auf die Analyse-Tools und Techniken angewiesen, um die Daten auf sinnvolle Weise helfen präsentieren.

Neue Anwendungen kommen zur Verfügung und wird im Großen und Ganzen in zwei Kategorien fallen: custom oder Semi-Custom.

Kundenspezifische Anwendungen für große Datenanalyse

Im Allgemeinen ist eine kundenspezifische Anwendung für einen bestimmten Zweck oder einem verwandten Satz von Zwecken erstellt. Für große Datenanalyse, ist der Zweck der Entwicklung kundenspezifischer Anwendungen, die Zeit zu Entscheidungen oder Maßnahmen zu beschleunigen.

R Umwelt

Das # 147-R # 148- Umgebung basiert auf der # 147-S # 148- Statistiken und Analysen Sprache in den 1990er Jahren entwickelt von den Bell Laboratories. Es wird von der GNU-Projekt gepflegt und steht unter der GNU-Lizenz zur Verfügung.

Während schwierig zu vollständig zu verstehen, seine Tiefe und Flexibilität es eine überzeugende Wahl für die Analytik Anwendungsentwickler machen und # 147-Power-User. # 148- Darüber hinaus unterhält das CRAN R Projekt eine weltweite Reihe von File Transfer Protocol und Web-Server mit den meisten up-to-date Versionen der R-Umgebung. Ein kommerziell unterstützte, Enterprise-Version von R ist auch aus dem Revolution Analytics.

Genauer gesagt ist R eine integrierte Suite von Software-Tools und Technologien, kundenspezifische Anwendungen zu erleichtern, Datenmanipulation, Berechnung, Analyse und visuelle Anzeige verwendet zu erstellen. Unter anderem erweiterte Funktionen unterstützt es

  • Effektive Datenbearbeitung und Manipulation Komponenten.

  • Operatoren für Berechnungen auf Arrays und andere Arten von geordneten Daten.

  • Tools spezifisch für eine Vielzahl von Datenanalysen.

  • Erweiterte Visualisierungsfunktionen.

  • S Programmiersprache, die von Programmierern entwickelt, für Programmierer mit vielen bekannten Konstrukte, einschließlich Bedingungen, Schleifen, benutzerdefinierte rekursive Funktionen und eine breite Palette von Ein- und Ausgangsmöglichkeiten.

R ist gut geeignet für den einmaligen Gebrauch, benutzerdefinierte Anwendungen für die Analyse von großen Datenquellen.

Google Prediction API

Die Google Prediction API ist ein Beispiel für eine neue Klasse von großen Datenanalyse Anwendungstools. Es ist auf der Google-Entwickler-Website und ist gut dokumentiert und mit mehreren Mechanismen für den Zugang mit unterschiedlichen Programmiersprachen zur Verfügung gestellt. Um Ihnen den Einstieg ist es für sechs Monate frei verfügbar.

Die Prediction API ist ziemlich einfach. Es sucht nach Mustern und passt sie an proscriptive, normativ oder andere bestehende Muster. Während die Musteranpassung durchführt, ist es auch # 147-lernt. # 148- Je mehr Sie es verwenden, desto schlauer wird es.

Vorhersage ist als RESTful API mit Sprachunterstützung implementiert für .NET, Java, PHP, javascript, Python, Ruby, und viele andere. Google bietet auch Skripts, die die API sowie eine Client-Bibliothek für R. für den Zugriff auf

Prädiktive Analyse ist eine der mächtigsten potenziellen Fähigkeiten der großen Daten und die Google Prediction API ist ein sehr nützliches Werkzeug für kundenspezifische Anwendungen zu erstellen.

Semi-Custom-Anwendungen für große Datenanalyse

In Wahrheit, was empfinden viele Menschen als benutzerdefinierte Anwendungen tatsächlich erstellt werden # 147-verpackt # 148- oder Komponenten von Drittanbietern wie Bibliotheken. Es ist nicht immer notwendig, um vollständig eine neue Anwendungscode. Mit verpackten Anwendungen oder Komponenten erfordert Entwickler oder Analysten Code schreiben, um # 147-stricken zusammen # 148- diese Komponenten in eine funktionierende benutzerdefinierte Anwendung. Im Folgenden sind Gründe, warum dies ein vernünftiger Ansatz ist:

  • Speed-Bereitstellung: Weil Sie nicht jeden Teil der Anwendung zu schreiben, kann die Entwicklungszeit erheblich reduziert werden.

  • Stabilität: Mit gut ausgebaute, zuverlässige Komponenten von Drittanbietern kann dazu beitragen, die benutzerdefinierte Anwendung elastischer zu machen.

  • Bessere Qualität: Verpackt Komponenten unterliegen oft höhere Qualitätsstandards, weil sie in einer Vielzahl von Umgebungen und Bereichen eingesetzt werden.

  • Mehr Flexibilität: Wenn eine bessere Komponente entlang kommt, kann es in die Anwendung ausgetauscht werden, zur Verlängerung der Lebensdauer, Anpassungsfähigkeit und Nützlichkeit der benutzerdefinierten Anwendung.

Eine andere Art von Semi-Custom-Anwendung ist eine, wo der Quellcode zur Verfügung und wird für einen bestimmten Zweck modifiziert. Dies kann ein effizienter Ansatz, denn es gibt durchaus ein paar Beispiele für die Anwendung Bausteine ​​sind verfügbar in Ihre Semi-Custom-Anwendung zu übernehmen:

  • TA-Lib: Die Technische Analyse Bibliothek wird weitgehend von Software-Entwicklern verwendet, die technische Analyse von Finanzmarktdaten durchführen müssen. Es ist als Open Source unter der BSD-Lizenz, so dass sie in halbkundenspezifische Anwendungen integriert werden.

  • JUNG: Das Java-Universal Network Graph Framework ist eine Bibliothek, die einen gemeinsamen Rahmen für die Analyse und Visualisierung von Daten zur Verfügung stellt, die durch ein Diagramm oder ein Netzwerk dargestellt werden kann. Es ist nützlich für die Analyse sozialer Netzwerke, wie wichtig Maßnahmen und Data Mining. Es ist als Open Source unter der BSD-Lizenz.

  • GeoTools: Ein Open-Source Geospatial-Toolkit GIS-Daten in vielen Formen für die Manipulation, Analyse räumlicher und nicht-räumliche Attribute oder GIS-Daten und Graphen und Netzwerke der Daten zu schaffen. Sie steht unter der GPL2-Lizenz zur Verfügung, so dass für die Integration in semi-kundenspezifische Anwendungen.

Menü