Statistik für Dummies

Wenn Sie mit der Bevölkerung und Proben (eine Teilmenge von einer Bevölkerung) in Unternehmensstatistik arbeiten, können Sie drei Arten von Maßnahmen verwenden, um die Datenmenge zu beschreiben: zentrale Tendenz, Dispersions- und Assoziation.

Per Konvention die statistischen Formeln Bevölkerung Maßnahmen zu beschreiben, enthalten griechische Buchstaben, während die Formeln verwendet, um Probe Maßnahmen enthalten lateinischen Buchstaben beschreiben.

Maße der zentralen Tendenz

In der Statistik der Mittelwert, Median und Modus werden als Maßnahmen bekannt zentrale Tendenz- sie werden verwendet, um das Zentrum eines Datensatzes zu identifizieren:

  • Bedeuten: Der Wert zwischen dem größten und kleinsten Werte eines Datensatzes durch ein vorgeschriebenes Verfahren erhalten werden.

  • Median: Der Wert, der einen Datensatz in zwei gleiche Hälften teilt

  • Modus: Die am häufigsten beobachteten Wert in einem Datensatz

Proben werden aus Populationen zufällig ausgewählt. Wenn dieser Vorgang korrekt durchgeführt wird, sollte jede Probe genau die Eigenschaften der Population widerspiegeln. So wird eine Probe messen, beispielsweise die bedeuten, sollte eine gute Schätzung der entsprechenden Bevölkerung Maßnahme. Betrachten Sie die folgenden Beispiele bedeuten:

Bevölkerung bedeuten:

Diese Formel einfach sagt Ihnen, von der Größe der Bevölkerung, alle Elemente in der Bevölkerung und Spaltung zu addieren.

Probenmittel:

bild0.jpg

Der Prozess dieser für die Berechnung ist genau die gleichgeschlechtlicher Sie alle Elemente in der Probe und dividiert durch die Größe der Probe addieren.

Zusätzlich zu den Maßnahmen der zentralen Tendenz, zwei andere wichtige Arten von Maßnahmen sind Maßnahmen der Dispersion (Spread) und Maßnahmen des Vereins.

Maßnahmen der Dispersion

Maßnahmen der Dispersion umfassen Varianz / Standardabweichung und Perzentile / Quartile / Quartilsabstand. Die Varianz und Standardabweichung sind eng mit jeweils bezogen Andere- die Standardabweichung der immer gleich Quadratwurzel der Varianz.

Die Formeln für die Bevölkerung und die Stichprobenvarianz sind:

Varianz:

image1.jpg

Stichprobenvarianz:

image2.jpg

Perzentile Split ein Datensatz in 100 gleiche Teile mit jeweils 1 Prozent der Werte in dem Datensatz aus. Quartile eine besondere Art von sind percentiles- sie die Daten in vier gleiche Teile aufgeteilt. Das Interquartil Bereich stellt die mittleren 50 Prozent der Daten- es als das dritte Quartil minus ersten Quartil berechnet wird.

Maßnahmen des Vereins

Eine andere Art von Maßnahme, als bekannt Maß Verband, bezieht sich auf Beziehung zwischen zwei Proben oder zwei Populationen. Zwei Beispiele hierfür sind die Kovarianzund das Korrelation:

Bevölkerung Kovarianz:

image3.jpg

Beispiel Kovarianz:

image4.jpg

Bevölkerung Korrelation:

image5.jpg

Beispiel Korrelation:

image6.jpg

Die Korrelation wird eng mit der covariance- es definiert ist, um sicherzustellen, dass ihr Wert immer zwischen negativ und positiv.

Zufallsvariablen und Wahrscheinlichkeitsverteilungen in Unternehmensstatistik

Zufallsvariablen und Wahrscheinlichkeitsverteilungen sind zwei der wichtigsten Konzepte in der Statistik. EIN Zufallsvariable ordnet eindeutige numerische Werte für die Ergebnisse einer zufällige experiment- Dies ist ein Prozess, der unsichere Ergebnisse erzeugt. EIN Wahrscheinlichkeitsverteilung ordnet Wahrscheinlichkeiten jeden möglichen Wert einer Zufallsvariablen.

Die zwei Grundtypen von Wahrscheinlichkeitsverteilungen sind diskret und kontinuierlich. Eine diskrete Wahrscheinlichkeitsverteilung kann nur davon ausgehen, endlich Anzahl verschiedener Werte.

Beispiele für diskrete Verteilungen umfassen:

  • Binomial

  • Geometrisch

  • Poisson

Eine kontinuierliche Wahrscheinlichkeitsverteilung kann eine davon ausgehen, unendlich Anzahl verschiedener Werte. Beispiele für kontinuierliche Verteilungen umfassen:

  • Uniform

  • Normal

  • Student t

  • Chi-Quadrat

  • F

Verstehen Sie Stichprobenverteilungen in Unternehmensstatistik

In der Statistik sind Stichprobenverteilungen die Wahrscheinlichkeitsverteilungen von einem bestimmten Statistik auf einer Stichprobe basiert, und sind wichtig, weil sie eine erhebliche Vereinfachung auf der Strecke zu statistische Inferenz liefern. Insbesondere ermöglichen sie analytischen Betrachtungen über die Stichprobenverteilung einer Statistik basieren, und nicht auf der gemeinsamen Wahrscheinlichkeitsverteilung aller einzelnen Abtastwerte.

Der Wert einer Probe Statistik wie der Stichprobenmittelwert (X) ist wahrscheinlich für jede Probe unterschiedlich zu sein, die aus einer Population gezogen wird. Es kann daher sein, wie ein Gedanke von Zufallsvariable, deren Eigenschaften mit a beschrieben Wahrscheinlichkeitsverteilung. Die Wahrscheinlichkeitsverteilung einer Probe Statistik als ein bekannter Stichprobenverteilung.

Nach einem Schlüsselergebnis in der Statistik als zentrale Grenzwertsatz, der Stichprobenverteilung der Probe bekannt bedeuten ist normal, wenn eines von zwei Dingen ist wahr:

  • Die zugrunde liegende Bevölkerung ist normal

  • Die Probengröße beträgt mindestens 30

Zwei Momente erforderlich sind Wahrscheinlichkeiten für die Probe zu berechnen meine- den Mittelwert der Stichprobenverteilung ist gleich:

image0.png

Die Standardabweichung der Stichprobenverteilung (auch bekannt als Standart Fehler) Kann auf eine von zwei möglichen Werte annehmen:

image1.png

Dies ist die geeignete Wahl für eine "kleine" Proben- beispielsweise die Probengröße kleiner oder gleich 5 Prozent der Bevölkerung groß.

Wenn die Probe "groß", die Standardfehler wird:

image2.png

Wahrscheinlichkeiten kann für die Probe berechnet werden, die unmittelbar aus der Standardnormal Tabelle nach folgender Formel berechnet:

image3.png

Entdecken Hypothesentests in Unternehmensstatistik

In der Statistik hypothesis Prüfung bezieht sich auf den Prozess zwischen konkurrierenden Hypothesen über einer Wahrscheinlichkeitsverteilung, basierend auf den beobachteten Daten von der Verteilung der Wahl. Es ist ein Kernthema und ein grundlegender Bestandteil der Sprache der Statistik.

Das Testen von Hypothesen ist ein Sechs-Stufen-Verfahren:

1.Null Hypothese

2.Alternative Hypothese

3.Level von Bedeutung

4.Test Statistik

5.Critical Wert (e)

6.Decision Regel

Das Nullhypothese ist eine Aussage, die stark es um wahr zu sein, es sei denn widersprüchliche Aussagen ist davon ausgegangen wird. Das alternative Hypothese ist eine Aussage, die anstelle der Nullhypothese akzeptiert wird, wenn er abgelehnt wird.

Das Signifikanzniveau gewählt wird, um die Wahrscheinlichkeit einer "Typ I" ERROR- der Fehler dadurch zu steuern, dass, wenn die Nullhypothese ergibt fälschlicherweise zurückgewiesen.

Das Teststatistik und kritische Werte werden verwendet, um festzustellen, ob die Nullhypothese zurückgewiesen. Das Entscheidungsregel dass gefolgt ist, dass eine "extreme" Teststatistik führt zu Ablehnung der Nullhypothese. Hier wird eine extreme Teststatistik ist eine, die außerhalb der Grenzen des kritischen Wert oder die Werte liegt.

Hypothesen werden häufig über die Werte der Bevölkerungs Maßnahmen wie der Mittelwert und die Varianz getestet. Sie werden auch zu bestimmen, ob eine Population folgt einer vorgegebenen Wahrscheinlichkeitsverteilung verwendet. Sie bilden auch einen großen Teil der Regressionsanalyse, in dem Hypothesen verwendet werden, um die Ergebnisse einer geschätzten Regressionsgleichung zu validieren.

Wie Unternehmen verwenden Regressionsanalyse Statistik

Regressionsanalyse ist ein statistisches Werkzeug für die Untersuchung der Beziehungen zwischen den Variablen. Normalerweise sucht der Forscher den kausalen Effekt einer Variablen auf eine andere zu ermitteln - die Wirkung einer Preiserhöhung bei Bedarf, zum Beispiel, oder die Auswirkungen von Änderungen in der Geldmenge auf die Inflationsrate.

Regressionsanalyse wird verwendet, um die Stärke und die Richtung der Beziehung zwischen zwei linear bezogenen Variablen zu ermitteln: X und Y X ist die "independent" variable und Y ist die "abhängig" Variable.

Die zwei Grundtypen von Regressionsanalyse, sind:

  • Einfache Regressionsanalyse: Verwendet, um die Beziehung zwischen einer abhängigen Variablen und einer einzigen unabhängigen variabel- zum Beispiel abschätzen zu können, die Beziehung zwischen der Ernteerträge und Niederschläge.

  • Die multiple Regressionsanalyse: Verwendet, um die Beziehung zwischen einer abhängigen Variablen und zwei oder mehreren unabhängigen Variablen- zum Beispiel abschätzen zu können, ist die Beziehung zwischen den Gehältern der Arbeitnehmer und ihrer Erfahrung und Ausbildung.

    Die multiple Regressionsanalyse stellt einige zusätzliche Komplexität kann aber realistischere Ergebnisse als einfache Regressionsanalyse erzeugen.

Die Regressionsanalyse basiert auf mehreren starken Annahmen über die Variablen, die geschätzt werden. Es werden mehrere Schlüssel Tests verwendet, um sicherzustellen, dass die Ergebnisse gültig sind, einschließlich Hypothesentests. Diese Tests werden verwendet, um sicherzustellen, dass die Regressionsergebnisse sind nicht einfach durch zufällige Chance sondern zeigen eine tatsächliche Beziehung zwischen zwei oder mehr Variablen.

Eine geschätzte Regressionsgleichung kann für eine Vielzahl von Geschäftsanwendungen, wie beispielsweise eingesetzt werden:

  • Messung der Auswirkungen auf einen Gewinn des Unternehmens von einem Anstieg der Gewinne

  • Zu verstehen, wie empfindlich ein Umsatz sind die Unternehmen zu Änderungen der Werbeausgaben

  • Zu sehen, wie ein Aktienkurs von Zinsänderungen betroffen ist

Die Regressionsanalyse kann auch für die Prognose purposes- zum Beispiel verwendet werden, kann eine Regressionsgleichung verwendet werden, um die künftige Nachfrage zu prognostizieren für die Produkte eines Unternehmens.

Aufgrund der extremen Komplexität der Regressionsanalyse wird oft durch den Einsatz von Spezialrechner oder Tabellenkalkulationsprogrammen implementiert.

Menü