Grundlagen der statischen und gestreamten Daten in Predictive Analyics

Daten in Predictive Analytics können als Stream, statisch, oder eine Mischung aus beidem identifiziert werden. gestreamten Daten Änderungen continuously- Beispiele sind die konstanten Strom von Facebook-Updates, Tweets auf Twitter, und die Aktienkurse ständig ändert, während der Markt immer noch offen ist.

Gestreamten Daten kontinuierlich Umkleide- statische Daten ist in sich abgeschlossen und umschlossen. Die Probleme im Zusammenhang mit statischen Daten enthalten Lücken, Ausreißer oder falsche Daten, von denen alle erfordern eine gewisse Reinigung, Vorbereitung und Vorverarbeitung, bevor Sie statische Daten für eine Analyse verwenden können.

Wie bei gestreamten Daten können andere Probleme auftreten. Die Lautstärke kann eine problem- sein die schiere Menge an Non-Stop-Daten ständig ankommen überwältigend sein. Und je schneller die Daten-Streaming in, desto schwieriger ist es für die Analyse von bis zu fangen.

Die zwei Hauptmodelle für gestreamte Datenanalyse sind wie folgt:

  • Untersuchen Sie nur die neuesten Datenpunkte und eine Entscheidung über den Status des Modells machen und seine nächsten Zug. Dieser Ansatz ist inkrementell - im Wesentlichen ein Bild von den Daten aufzubauen, wie es kommt.

  • Beurteilen Sie den gesamten Datensatz oder eine Teilmenge davon, eine Entscheidung jedes Mal, wenn neue Datenpunkte kommen zu machen. Dieser Ansatz ist inklusive mehr Datenpunkte in der Analyse - was das ausmacht # 147-gesamten # 148- Datensatzes ändert sich jedes Mal, wenn neue Daten hinzugefügt wird.

Je nach Art Ihres Unternehmens und der zu erwartenden Auswirkungen der Entscheidung, ist ein Modell über den anderen zu bevorzugen.

Einige Geschäftsbereiche, wie zum Beispiel die Analyse von Umwelt-, Markt oder Intelligence-Daten, Gewinn neue Daten, die in Echtzeit ankommt. Alle diese Daten müssen analysiert werden, wie es gestreamt werden - und interpretiert nicht nur richtig, sondern sofort.

Basierend auf dem neu verfügbaren Informationen, zeichnet das Modell die gesamte interne Darstellung der Außenwelt. Dadurch bietet Ihnen die meisten up-to-date Basis für eine Entscheidung, die Sie benötigen, um auf schnell zu machen und zu handeln.

Zum Beispiel kann ein Predictive Analytics-Modell einen Aktienkurs als Datenfeed zu verarbeiten, auch wenn die Daten schnell ändern, um die Daten im Zusammenhang mit der unmittelbaren Marktbedingungen zu analysieren und in Echtzeit vorhanden, und dann entscheiden, ob eine bestimmte Aktie zu handeln.

Offensichtlich unterscheidet sich von der Analyse von statischen Daten gestreamten Daten zu analysieren. eine Mischung aus beiden Datentypen analysieren kann sogar eine größere Herausforderung sein.

Menü