Wichtige statistische Formeln für Big Data

Das Wort Statistiken

kann in einigen Anfänger zu Datenvisualisierung evozieren Angst, aber wenn Sie dieses Thema zu ignorieren, Sie blicken auf eine der mächtigsten Möglichkeiten, wirkliche Einsicht und den Wert von Big Data abzuleiten.

Statistiken ist die Praxis oder Wissenschaft von numerischen Daten in großen Mengen zu sammeln. Sie müssen einen Daten Wissenschaftler gehen nicht aus und werden (ein Begriff für Statistiker verwendet, die auch Daten-Freaks in der Verkleidung sind und die in der Regel eine Art von fortgeschrittenen Grad halten, wie ein PhD), aber Sie können Kommissionierung bis zu betrachten wollen eine Statistik 101 Buch oder Klasse, wenn Sie Interesse haben.

Statistische Formeln wie Wahrscheinlichkeit, Varianz und Prognose sind heute populär. Sie sind ziemlich einfach zu jedem Datensatz anzuwenden, und die meisten Leser werden ihnen klar zu verstehen. Sie können einige dieser statistischen Formeln in die Big Data-Visualisierungen integrieren wahren Wert für die Nutzer, indem sie die in den folgenden Abschnitten besprochen Techniken zur Verfügung zu stellen.

Zu wissen, die Wahrscheinlichkeit, dass ein Ereignis eintreten wird

Eine statistische Formel, die Sie nicht vertraut sind mit ist probability - die Wahrscheinlichkeit oder Chance, dass ein Ereignis folgender Formel berechnet für eine lineare Szenario Basis Wahrscheinlichkeit occur.The kann. (Nonlinear Szenarien sind ein wenig komplex und zu viel von einem Unternehmen für einen Neuling.)

Wahrscheinlichkeit = Wahrscheinlichkeit ein Ereignis eintreten wird / Anzahl der möglichen Ergebnisse

Die folgende Abbildung zeigt eine Wahrscheinlichkeit mit einigen Alarm Farben hinzugefügt die Nachricht leicht zu lesen ist und, ganz wichtig, zu zeigen deutlich, dass sofortiges Handeln erforderlich ist.

bild0.jpg

Probabilities bieten eine schnelle Realität zu überprüfen und stellen Sie den Gesamtklang für die Geschichte der Visualisierung von Daten während eines bestimmten Zeitraums zur Verfügung stellen (Tag, Woche, Quartal, und so weiter).

Anwenden Varianz der Größe der Veränderung zu zeigen,

Eine andere beliebte statistische Maß ist variance, die die Differenz zwischen einem Satz von Datenpunkten.

Die am häufigsten verwendete Formel Varianz für die Berechnung ist

Variance = Schlusswunsch - Aktueller Stand

Ob der angezeigte Ausgang eine ganze Zahl oder Prozentsatz ist, zeigt die Formel die Größe der Änderung zwischen dem Anfang und Endzustand eines Datenpunktes.

die Varianz Anzeige ist immer schnell zu gewinnen und ein großartiger Ersatz für die Linie / Balkendiagramm-Combo, die ist, wie die Varianz Beziehung in den meisten Visualisierungen angezeigt wird.

Die Grafik in der Abbildung unten zeigt eine Linie / Balkendiagramm Combo, die der Benutzer entschlüsseln die Varianz für jeden Monat können.

image1.jpg

Das zweite Diagramm, in der folgenden Abbildung dargestellt, zeichnet eindeutig die Varianz und nimmt alle Vermutungen aus dem visuellen.

image2.jpg

Prognose für die Zukunft

Noch eine weitere beliebte statistische Formel, die Sie mit vertraut sein kann, ist die forecast, das ist der Akt der Vorhersage oder ein Ereignis oder einen Trend zu schätzen.

Wenn Sie eine Prognose berechnen, sind Sie wirklich eine bestimmte Menge an historischen Daten über das Verhalten, ein bestimmtes Ereignis vorherzusagen, oder einen Trend. Zum Beispiel könnten Sie den Umsatz für das Jahr berechnet auf der historischen Tatsache, dass in der Regel Januar 5% des Umsatzes ausmacht. Wenn Sie $ 500 Verkäufe im Januar machte dann würden Sie die folgende Formel verwenden, um vorherzusagen, wie viel Umsatz Sie können für das Jahr vorwegzunehmen:

$ 500 / .05 = $ 10.000

In dieser Gleichung $ 500 ist der Umsatz in Januar- .05 die historische Prozentsatz des Umsatzes ist die Januar-Konten for- und $ 10.000 ist die erwarteten Umsatz für das Jahr.

Die folgende Abbildung zeigt, wie Prognosen in den meisten Datenvisualisierungen als einfache Linie in einem Diagramm dargestellt werden. Die Prognosen zeigen, wie eine bestimmte Aktivität in der Zukunft führen kann.

Dieses typische Anzeige einer Prognose Linie zeigt, dass Cash-Flow wird schließlich zu einem Problem werden für th
Dieses typische Anzeige einer Prognose Linie zeigt, dass Cash-Flow wird schließlich ein Thema für diese Organisation.

Menü