Prognoseverfahren in der statistischen Analyse von Big Data

Viele verschiedene Techniken wurden den zukünftigen Wert einer Variablen zu prognostizieren entworfen. Zwei davon sind Zeitreihen Regressionsmodelle und Simulationsmodelle.

Menu

Zeitreihe Regressionsmodelle

EIN Zeitreihen Regressionsmodell wird verwendet, um den Trend von einer zeitlich veränderliche gefolgt abzuschätzen, Regressionstechniken. EIN Trendlinie zeigt die Richtung, in der eine Variable wie die Zeit verstreicht, bewegt.

Als Beispiel zeigt die Figur eine Zeitreihe, die die jährliche Produktion von einer Goldmine stellt vor (gemessen in Tausend Unzen pro Jahr), da die Mine 10 Jahre geöffnet.

Eine Zeitreihe Goldproduktion für den letzten zehn Jahren pro Jahr zeigt.
Eine Zeitreihe Goldproduktion für den letzten zehn Jahren pro Jahr zeigt.

Die Gleichung der Trendlinie wird geschätzt sein,

Y = 0,9212X + 1,3333

woher

X ist das Jahr.
Y ist die jährliche Produktion von Gold (in Tausend Unzen gemessen).

Diese Trendlinie wird mittels Regressionsanalyse geschätzt. Die Trendlinie zeigt, dass im Durchschnitt der Ausgang der Mine von 0,9212 Tausend (921,2 Unzen) pro Jahr wächst.

Sie könnten diese Trendlinie, um die Ausgabe im nächsten Jahr (das 11. Betriebsjahr) zur Vorhersage von 11 Ersatz für X, wie folgt:

Y = 0,9212X + 1,3333
Y = 0,9212 (11) + 1,3333 = 11,4665

Basierend auf der Trendlinie Gleichung würde die Mine voraussichtlich 11,466.5 Unzen Gold im nächsten Jahr zu produzieren.

Simulationsmodelle

Sie können verwenden Simulation Modelle eine Zeitreihe zu prognostizieren. Simulationsmodelle sind extrem flexibel, kann aber sehr zeitaufwendig zu implementieren sein. Ihre Genauigkeit hängt auch von Annahmen über die Zeitreihendaten der statistischen Eigenschaften hergestellt werden.

Zwei Standard-Ansätze zur Vorhersage Finanzzeitreihen mit Simulationsmodellen sind historische Simulation und Monte-Carlo-Simulation.

Historische Simulation

historisch Simulation ist eine Technik verwendet, um eine Wahrscheinlichkeitsverteilung für eine Variable zu erzeugen, wie sie im Laufe der Zeit entwickelt sich, bezogen auf ihre früheren Werte. Wenn die Eigenschaften der variablen Wesen über die Zeit simuliert stabil bleiben, kann diese Technik sehr genau sein. Ein Nachteil dieses Ansatzes besteht darin, dass, um eine genaue Vorhersage zu bekommen, müssen Sie eine Menge von Daten zu haben. Es hängt auch von der Annahme, dass eine Variable Verhalten in der Vergangenheit in die Zukunft fortsetzen wird.

Als Beispiel zeigt diese Figur ein Histogramm, das die Rückkehr zu einer Aktie in den letzten 100 Tage darstellt.

Ein Histogramm der Aktienrenditen.
Ein Histogramm der Aktienrenditen.

Dieses Histogramm zeigt die Wahrscheinlichkeitsverteilung der Renditen der Aktie auf der Basis der letzten 100 Handelstage. Die Grafik zeigt, dass die häufigste Rückkehr in den letzten 100 Tage im Verlust von 2 Prozent, die zweithäufigste ein Verlust von 3 Prozent, und so weiter. Sie können die in diesem Diagramm enthaltenen Informationen verwenden, um eine Wahrscheinlichkeitsverteilung für die wahrscheinlichste Rendite dieser Aktie in den kommenden Handelstag zu schaffen.

Monte-Carlo-Simulation

Monte Carlo Simulation ist eine Technik, bei der Zufallszahlen in einem statistischen Modell, um ersetzt sind die zukünftigen Werte einer Variablen zu prognostizieren. Diese Methode wird in vielen verschiedenen Disziplinen, darunter Finanzen, Wirtschaft und den harten Wissenschaften wie Physik verwendet. Monte-Carlo-Simulation lassen sich sehr gut arbeiten, kann aber auch sehr zeitaufwendig zu implementieren. Auch seine Genauigkeit hängt von dem statistischen Modell verwendet wird, das Verhalten der Zeitreihe zu beschreiben.

Menü