Wie Datenglättung in Predictive Analytics verwenden

Datenglättung

in Predictive Analytics ist im Wesentlichen versucht, die zu finden # 147-Signal # 148- in der # 147-Rauschen # 148- von Datenpunkten zu verwerfen, die berücksichtigt werden # 147 rauschten # 148-. Die Idee ist es, die Muster in den Daten zu schärfen, und markieren Sie Trends die Daten zeigt.

bild0.jpg

Die Implikation hinter Datenglättung ist, dass die Daten besteht aus zwei Teilen: ein Teil (bestehend aus dem Kerndatenpunkte), Die allgemeinen Trends oder reale Trends bedeutet, und einen anderen Teil, der größtenteils von Abweichungen besteht (Lärm) - Einige fluktuierenden Punkte, die von einer gewissen Volatilität in den Daten führen. Datenglättung versucht, diese zweite Teil zu beseitigen.

Wie unten zu drehen den Lärm

Datenglättung arbeitet auf mehreren Annahmen:

  • Dass Schwankungen der Daten wahrscheinlichsten Rauschen zu sein.

  • Dass der laut Teil der Daten ist von kurzer Dauer.

  • Daß die Schwankung der Daten, unabhängig davon, wie vielfältig sie auch sein mag, werden die zugrunde liegenden Entwicklungen nicht beeinflussen durch die Kerndatenpunkte dargestellt.

Das Rauschen in Daten dazu neigen, ihre Schwankungen zu RANDOM- nicht die allgemeinen Trends gezogen aus der Prüfung der Rest der Daten beeinflussen sollte. So reduzieren oder zu laut Datenpunkte beseitigen können echte Trends und Muster in den Daten zu klären - in der Tat, die Verbesserung der Daten des # 147-Signal-zu-Rausch-Verhältnis # 148.

Vorausgesetzt, Sie haben das Rauschen richtig erkannt haben und reduziert dann können Datenglättung helfen Ihnen die nächsten beobachteten Daten zeigen Sie einfach, indem Sie die wichtigsten Trends Sie innerhalb der Daten haben festgestellt, vorherzusagen.

Datenglättung beschäftigt sich mit der Mehrheit der Datenpunkte, deren Positionen in einem Diagramm, und dem, was die resultierenden Muster vorhersagen, über den allgemeinen Trend von (sagen wir) ein Aktienkurs, ob seine allgemeine Richtung nach oben, unten oder seitwärts.

Diese Technik wird nicht genau vorhersagen den genauen Preis des nächsten Trade für eine bestimmte Aktie - aber einen allgemeinen Trend vorhersagen können leistungsstärkere Erkenntnisse bringen als der tatsächliche Preis oder seine Schwankungen zu kennen.

Eine Prognose basiert auf einem allgemeinen Trend von geglätteten Daten abgeleitet wird davon ausgegangen, dass die Daten welcher Richtung auch immer so weit gefolgt ist, in die Zukunft in einer Art und Weise im Einklang mit dem Trend fortsetzen wird. In der Börse, zum Beispiel, ist die historische Performance keinen definitiven Hinweis auf die zukünftige Performance, aber es kann sicherlich eine allgemeine Garantie für zukünftige Bewegung des Aktienkurses sein.

Methoden, Vorteile und Nachteile der Datenglättung

Datenglättung wird nicht verwechseln mit Einbau eines Modells, das ist Teil der Analysedaten, bestehend aus zwei Schritten:

  1. Finden Sie ein geeignetes Modell, das die Daten darstellt.

  2. Stellen Sie sicher, dass das Modell effektiv an die Daten angepasst.

Datenglättung konzentriert sich eine grundlegende Richtung für die Kerndatenpunkte zur Festlegung von (1) alle laut Datenpunkte ignoriert und (2) eine glattere Kurve durch die Datenpunkte zeichnen, die die zappelnden diejenigen überspringt und betont primäre Muster - Trends - in den Daten, egal, wie ihre Entstehung verlangsamen. Dementsprechend dient in einer numerischen Zeitreihe, Datenglättung als eine Form der Filterung.

Daten Glättung kann eine der folgenden Methoden verwenden:

  • Zielloser Spaziergang auf der Idee basiert, dass die nächste Ergebnis oder zukünftige Datenpunkt, eine zufällige Abweichung von der letzten bekannt ist oder vorhanden ist, Datenpunkt.

  • Gleitender Durchschnitt ist ein Durchschnitt von aufeinanderfolgenden, in gleichen Abständen Perioden ausgeführt wird. Ein Beispiel wäre die Berechnung eines 200-Tage gleitenden Durchschnitt eines Aktienkurses.

  • Exponentielle Glättung weist exponentiell mehr Gewicht oder Bedeutung, auf die jüngsten Datenpunkte als auf ältere Datenpunkte.

  • Einfach: Diese Methode sollte verwendet werden, wenn die Zeitreihendaten keinen Trend und keine Saisonalität hat.

  • Linear: Dieses Verfahren sollte verwendet werden, wenn die Zeitreihendaten eine Trendlinie aufweist.

  • Saisonal: Diese Methode sollte verwendet werden, wenn die Zeitreihendaten keinen Trend aber Saisonalität hat.

Was diese Glättungsverfahren alle gemeinsam haben, ist, dass sie irgendeine Art von Mittelungsprozess Punkte auf mehrere Daten durchzuführen. Eine solche Mittelung benachbarter Datenpunkte ist die wesentliche Art und Weise auf die zugrunde liegende Trends oder Muster auf Null in.

Die Vorteile der Datenglättung sind

  • Es ist einfach zu implementieren.

  • Es hilft, Trends zu erkennen.

  • Es hilft Muster in den Daten aus.

  • Es eliminiert Datenpunkte, die Sie nicht von Interesse entschieden haben.

  • Es hilft, die allgemeine Richtung der nächsten beobachteten Datenpunkte vorherzusagen.

  • Es erzeugt schöne glatte Grafiken.

Aber alles hat eine Kehrseite. Die Nachteile der Datenglättung sind

  • Es kann gültige Datenpunkte zu beseitigen, die von Extremereignissen führen.

  • Es kann zu ungenauen Vorhersagen führen, wenn die Testdaten nur saisonal und nicht vollständig repräsentativ für die Realität, dass die Datenpunkte generiert.

  • Er kann die Daten verschieben oder verdrehen, vor allem die Spitzen, was zu einem verzerrten Bild von dem, was vor sich geht.

  • Es kann zu erheblichen Störungen von Ausreißern in den Daten anfällig sein.

  • Es kann in einer großen Abweichung von der ursprünglichen Daten führen.

Wenn Datenglättung nicht mehr tut, als die Daten, die eine bloße Facelift geben, kann es eine grundlegend falsch auf folgende Arten ziehen:

  • Es können Fehler durch Verzerrungen einführen, die die geglätteten Daten behandeln, als ob es auf die Originaldaten identisch waren.

  • Es kann Interpretation durch Ignorieren Skew - und Verstecken - Risiken in den Daten eingebettet.

  • Es kann innerhalb Ihrer Daten zu einem Detailverlust führen - das ist eine Möglichkeit, dass eine geglättete Kurve aus, dass der Originaldaten stark abweichen.

Wie ernst Datenglättung Ihre Daten beeinflussen können, hängt von der Art der Daten zur Hand und Technik, die Glättung wurde auf diesen Daten implementiert. Zum Beispiel, wenn die Originaldaten in mehrere Peaks hat, dann werden Daten zu den Hauptglättungs Verschiebung der Peaks in den geglätteten Graphen führen - wahrscheinlich eine Verzerrung.

Hier sind einige warnende Punkte im Auge zu behalten, wie Sie Datenglättung nähern:

  • Es ist eine gute Idee geglätteten Graphen unangetastet Graphen zu vergleichen, die die ursprünglichen Daten grafisch darzustellen.

  • Die Datenpunkte während der Datenglättung entfernt möglicherweise nicht geräusch- sie gültig ist, reale Datenpunkte sein könnte, das Ergebnis sind von der seltenen-but-realen Ereignissen.

  • Daten Glättung kann in Maßen hilfreich sein, aber seine Übernutzung kann zu einer Verfälschung der Daten führen.

Durch die Anwendung Know-how Ihr fachmännisches Urteil und Ihr Wissen können Sie die Daten effektiv glätten verwenden. Entfernen von Rauschen aus Daten - ohne sich negativ auf die Genauigkeit und Nützlichkeit der ursprünglichen Daten zu beeinflussen - zumindest so viel eine Kunst als eine Wissenschaft.

Menü