Der Versuch, den Simulationsansatz in der statistischen Analyse

Moderne statistische Software macht es Ihnen leicht, Ihre Daten in den meisten Situationen zu analysieren, die Sie wahrscheinlich (zusammenfassen und Ihre Daten grafisch darstellen, berechnen Konfidenzintervall, gemeinsame Signifikanztests laufen, Regressionsanalyse zu tun, und so weiter) zu begegnen. Aber manchmal kann man auf ein Problem stoßen, für die keine vorprogrammierte Lösung existiert. neue statistische Verfahren ableiten können einige sehr komplizierte Mathematik beinhalten, und in der Regel nur eine professionelle theoretische Statistiker versucht, dies zu tun.

Aber es gibt eine einfache, aber allgemeine und leistungsstarke Möglichkeit, um Antworten auf eine Menge von statistischen Fragen, auch wenn man kein Mathe-Genie sind. Es Simulation genannt, oder die Monte-Carlo Technik.

Statistik ist die Untersuchung von zufälligen Schwankungen, und die meisten statistischen Probleme wirklich kommen auf die Frage # 147-Was tun die zufälligen Schwankungen? # 148- Nun, es stellt sich heraus, dass Computer bei Zeichnung Zufallszahlen aus einer Vielzahl von Distributionen sehr gut sind. Mit der richtigen Software können Sie einen Computer programmieren, um zufällige Schwankungen zu machen, die das Problem verkörpern Sie versuchen, Sie zu SolveDirect dann einfach sehen, was diese Schwankungen haben. Sie können dann diesen Vorgang mehrmals wiederholen und zusammenfassen, was auf lange Sicht passiert ist.

Der Simulationsansatz kann dazu verwendet werden, um Probleme in der Wahrscheinlichkeitstheorie zu lösen, bestimmen die statistische Signifikanz gemeinsam oder ungewöhnliche Situationen, die Berechnung der Leistung einer geplanten Studie, und vieles mehr. Hier ist eine einfache, wenn auch etwas gekünstelt, Beispiel dafür, was Simulation tun können:

Was ist die Chance, dass das Produkt der IQs von zwei zufällig ausgewählte Menschen als 12.000 größer ist?

IQs normal verteilt sind, mit einem Mittelwert von 100 und einer Standardabweichung von 15. (Und fragen Sie nicht, warum jemand möchte zwei IQ-Werte zu multiplizieren zusammen-es ist nur ein Beispiel!)

So einfach diese Frage klingen mag, es ist ein sehr schwieriges Problem genau zu lösen, und Sie würden ein Experte Mathematiker zu sein, müssen sie sogar versuchen. Aber es ist sehr einfach, eine Antwort durch Simulation zu erhalten. Genau dies tun:

  1. Generieren Sie zwei zufällige IQ Zahlen (in der Regel verteilt, m = 100, sd = 15).

  2. Multiplizieren Sie die beiden IQ Zahlen zusammen.

  3. Sehen Sie, ob das Produkt größer als 12.000 ist.

  4. Wiederholen Sie die Schritte 1-3 eine Million Mal und zählen, wie oft das Produkt 12.000 übersteigt.

  5. Teilen Sie diese Zählung um eine Million, und Sie haben Ihre Wahrscheinlichkeit.

Diese Simulation kann mit der kostenlosen Statistik 101-Programm oder auch Excel eingerichtet werden. Mit R-Software, können die fünf Schritte in einer einzigen Zeile programmiert werden:

Summe (rnorm (1000000,100,15) * rnorm (1000000,100,15)> 12000) / 1000000

Auch wenn Sie nicht vertraut mit R Syntax sind, können Sie wahrscheinlich die Drift zu fangen, was dieses Programm tut.

  • Jeder # 147-rnorm # 148- Funktion erzeugt eine Million Zufalls IQ-Werte.

  • Das # 147 - * # 148- multipliziert sie zusammen paarweise.

  • Das # 147 -> # 148- vergleicht jeweils eine Million Produkte auf 12.000.

  • Das # 147-Summe # 148- Funktion fügt die Anzahl der auf der Vergleich kommt wahr (wahr zählt als 1- falsch zählt als 0).

  • Das # 147 - / # 148- teilt die Summe durch eine Million.

R druckt die Ergebnisse der # 147-one-liner # 148- Programme wie diese, ohne dass Sie es explizit zu sagen, zu. Wenn eine Person, die dieses Programm auf seinem Desktop-Computer lief, berechnet es für etwa eine halbe Sekunde und gedruckt dann das Ergebnis: 0,172046. Dann lief er es wieder, und es gedruckt 0,172341. Das ist ein Merkmal von Simulationsmethoden - sie geben etwas andere Ergebnisse jedes Mal, wenn sie laufen. Und je mehr Simulationen Sie laufen, desto genauer sind die Ergebnisse sein. Deshalb sind die vorangegangenen Schritte für eine Million Wiederholungen fragen. Sie werden nicht eine genaue Antwort zu bekommen, aber Sie wissen, dass die Wahrscheinlichkeit ist um 0.172, die nahe genug ist.

Menü