Regressionsanalyse in der statistischen Analyse von Big Data

Regression Analyse wird verwendet, um die Stärke und Richtung der Beziehung zwischen den Variablen zu schätzen, sind linear miteinander in Beziehung. zwei Variablen X und Y sein sollen zu linear wenn die Beziehung zwischen ihnen im Zusammenhang kann in der Form geschrieben werden,

Y = mX + b

woher

m ist der Steigung, oder die Änderung der Y aufgrund einer bestimmten Änderung in X
b ist der abfangen, oder der Wert von Y wann X = 0

Als Beispiel für eine Regressionsanalyse an, dass eine Gesellschaft will, ob sich ihre Werbeausgaben zu bestimmen, tatsächlich Gewinne zu erhöhen, und wenn ja, um wie viel. Das Unternehmen sammelt Daten über die Werbung und die Gewinne für die letzten 20 Jahre und nutzt diese Daten, um die folgende Gleichung ermitteln:

Y = 50 + 0,25X

woher

Y vertritt die jährlichen Gewinne des Unternehmens (in Millionen Dollar).
X stellt die jährlichen Werbeausgaben des Unternehmens (in Millionen Dollar).

In dieser Gleichung ist die Steigung 0,25 entspricht, und der Schnittpunkt gleich 50. Da die Steigung der Regressionsgeraden 0,25 ist, zeigt dies, dass im Durchschnitt für jede Erhöhung $ 1 Million in der Werbeausgaben, die Gewinne steigen um $ 0,25 Millionen oder $ 250.000 . Da der Abschnitt 50 ist, bedeutet dies, dass ohne Werbung, Gewinne immer noch Millionen $ 50 wäre.

Diese Gleichung kann daher verwendet werden, um zukünftige Gewinne zu geplanten Werbeausgaben basiert zu prognostizieren. Zum Beispiel, wenn das Unternehmen auf die Ausgaben 10.000.000 $ für Werbung im nächsten Jahr plant, wird seine erwartete Gewinne wie folgt:

Y = 50 + 0,25X
Y = 50 + 0,25 (10) = 50 + 2,5 + 52,5

Daher mit einem Werbebudget von $ 10 Millionen im nächsten Jahr, Gewinne werden voraussichtlich $ 52.500.000 zu sein.

Menü