Die Bootstrap-Methode für Standardfehler und Konfidenzintervalle

Sie können den Standardfehler (SE) und Konfidenzintervall (CI) der häufigeren Probenstatistik (Mittel, Proportionen, Ereigniszahlen und Preise, und Regressionskoeffizienten) zu berechnen. Aber eine SE und CI existieren (zumindest theoretisch) für irgendein Mediane, Perzentile, Korrelationskoeffizienten und andere Größen, die komplizierten Berechnungen, unter einer Konzentration-versus-Zeit-Kurve (AUC) oder die geschätzte fünf-Jahres-Überlebenswahrscheinlichkeit wie der Bereich von einer abgeleiteten beinhalten könnte - Nummer, die Sie könnten möglicherweise von Ihren Daten wringen Überlebensanalyse. Formeln für die SE und CI um diese Zahlen möglicherweise nicht verfügbar oder vielleicht hoffnungslos schwierig sein, zu beurteilen. die Formeln auch, die nur für normalverteilte Zahlen existieren könnte gelten, und Sie können nicht sicher sein, welche Art von Verteilung Ihrer Daten folgt.

Betrachten wir ein sehr einfaches Problem. Angenommen, Sie haben den IQ von 20 Probanden gemessen und haben die folgenden Ergebnisse erzielt: 61, 88, 89, 89, 90, 92, 93, 94, 98, 98, 101, 102, 105, 108, 109, 113, 114 , 115, 120 und 138. Diese Zahlen haben einen Mittelwert von 100,85 und einen Medianwert von 99,5. Weil du ein guter Wissenschaftler sind, wissen Sie, dass, wenn Sie eine bestimmte Anzahl berichten haben Sie aus Ihren Daten berechnet (wie Mittelwert oder Median), werden Sie auch die Genauigkeit dieses Wertes in Form einer SE angeben möchten, und CI.

Für den Mittelwert, und wenn Sie, dass die IQ-Werte etwa normalverteilt annehmen kann, sind die Dinge ziemlich einfach. Sie können die SE des Mittelwertes als 3,54 und 95% CI um den Mittelwert als 93,4-108,3 berechnen.

Aber was ist mit der SE und CI für den Median, für die es keine einfachen Formeln? Und was ist, wenn Sie diese IQ-Werte sicher kommen aus einer Normalverteilung nicht sein kann? Dann werden die einfachen Formeln möglicherweise nicht zuverlässig sein.

Glücklicherweise gibt es eine sehr allgemeine Methode zur Schätzung der SEs und CIs für alles, was Sie aus Ihren Daten berechnen kann, und es erfordert keine Annahmen darüber, wie Sie Ihre Zahlen verteilt sind. Die SE jeder Probe Statistik ist die Standardabweichung (SD) der Stichprobenverteilung für die Statistik. Und die 95% Vertrauensbereich einer Probe Statistik sind gut durch die 2.5th und 97,5 Perzentile der Stichprobenverteilung dieser Statistik angenähert.

Also, wenn Sie könnten Ihre gesamte Experiment viele tausend Mal (mit einer anderen Auswahl von Themen jedes Mal), und jedes Mal berechnen und speichern Sie den Wert der Sache, die Sie interessiert sind (Median, AUC, oder was auch immer) zu replizieren, diese Sammlung von tausende von Werten wäre eine sehr gute Annäherung an die Stichprobenverteilung der Menge von Interesse sein. Dann könnten Sie die SE einfach als SD der Stichprobenverteilung abzuschätzen und die Vertrauensgrenzen von den Perzentile der Verteilung.

Aber eigentlich dieses Szenario Durchführung nicht möglich ist - Sie haben wahrscheinlich nicht die Zeit, Geduld, Geld oder Ihre gesamte Studie tausende Male durchzuführen. Glücklicherweise müssen Sie nicht auf die Studie tausende Male wiederholen eine Schätzung der Stichprobenverteilung zu erhalten. Sie können es tun, indem Sie die Daten von Ihrem einer tatsächlichen Untersuchung Wiederverwendung, immer und immer wieder! Das klingt zu schön, um wahr zu sein, und Statistiker waren von dieser Methode sehr skeptisch, wenn es wurde zum ersten Mal vorgeschlagen. Sie nannten es Bootstrapping, Vergleichen sie die unmögliche Aufgabe, # 147-Kommissionierung sich nach oben von Ihrem Schopf aus dem Sumpf # 148.

Aber es stellt sich heraus, dass, wenn Sie halten die gleichen Daten wiederverwenden in gewisser Weise, Diese Methode funktioniert tatsächlich. Im Laufe der Jahre hat sich die Bootstrap-Prozedur wird eine akzeptierte Art und Weise zuverlässige Schätzungen von SEs und CIs zu bekommen für fast alles, was Sie von Ihrem Daten- in der Tat berechnen kann, wird es oft als das zu sein, # 147-Gold-Standard # 148-, gegen die verschiedenen Näherungsformeln für SEs und CIs beurteilt werden.

Um zu sehen, wie die Bootstrap-Methode funktioniert, ist hier, wie Sie es verwenden, würde die SE und 95% CI des mittleren und den Median der 20 IQ-Werte gezeigt früher abzuschätzen. Sie müssen resample Ihre 20 Zahlen, immer und immer wieder, auf folgende Weise:

  1. Schreiben Sie alle Ihre Messungen auf einem separaten Zettel und steckte sie alle in einen Sack.

    In diesem Beispiel schreiben Sie die 20 gemessenen IQs auf separaten rutscht.

  2. Erreichen Sie in und ein Slip ziehen, schreiben diese Zahl nach unten, und legte den Slip wieder in die Tasche.

    (Dieser letzte Teil ist sehr wichtig!)

  3. Wiederholen Sie Schritt 2 so oft wie nötig, um die Anzahl der Messungen haben Sie übereinstimmen, den Schlupf an den Beutel jedes Mal zurück.

    Dies nennt man Resampling mit replacement, und erzeugt ein resampled Datensatz.In diesem Beispiel wiederholen Sie Schritt 2 19 weitere Male für insgesamt 20-mal (was die Anzahl der IQ-Messungen, die Sie haben).

  4. Berechnen Sie die gewünschte Sample-Statistik der neu abgetasteten Zahlen aus den Stufen 2 und 3, und die Zahl ist aufzuzeichnen.

    In diesem Beispiel finden Sie den Mittelwert und den Median der 20 gesampleten Zahlen.

  5. Wiederholen Sie die Schritte 2 bis 4 viele tausend Mal.

    Jedes Mal, erzeugen Sie eine neue resampled Datensatz, aus dem Sie berechnen und die gewünschten Probenstatistik aufnehmen (in diesem Fall der Mittelwert und Median des Datensatzes neu abgetastet). Sie winden mit Tausenden von Werten für die mittlere und Tausende von Werten für den Median.

    In jedem Datensatz neu abgetastet, treten einige der ursprünglichen Werte können mehr als einmal, und einige können gar nicht vorhanden sein. Fast jeder neu abgetastete Datensatz von allen anderen unterscheiden. Die Bootstrap-Methode basiert auf der Tatsache, dass diese bedeuten und Medianwerte von den Tausenden von neu abgetasteten Datensätze umfassen eine gute Schätzung der Stichprobenverteilung für den Mittelwert und Median. Zusammengefasst ähneln sie die Art der Ergebnisse, die Sie kann bekommen haben, wenn Sie Ihre aktuelle Studie immer und immer wieder wiederholt hatte.

  6. Berechnen Sie die Standardabweichung der Tausende von Werten der Stichprobenstatistik.

    Dieser Prozess gibt Ihnen ein # # 148- Schätzung der SE der Probe Statistik-147 Bootstrap. In diesem Beispiel berechnen Sie die SD von den Tausenden von Mitteln der SE des Mittelwertes zu erhalten, und Sie berechnen die SD von den Tausenden von Mediane der SE des Median zu bekommen.

  7. Beziehen Sie die 2.5th und 97,5 Perzentile der Tausenden von Werten der Stichprobenstatistik.

    Sie tun dies, indem Sie Ihre Tausende von Werten der Stichprobenstatistik in numerischer Reihenfolge sortiert wird, und dann die niedrigste 2,5 Prozent Abhacken und den höchsten 2,5 Prozent der sortierten Satz von Zahlen. Die kleinsten und größten Werte, die bleiben, sind die Bootstrap-Schätzung von niedrigen und hohen 95% Vertrauensgrenzen für die Stichprobenstatistik.

    In diesem Beispiel sind die 2.5th und 97,5 Perzentile der Mittelwerte und Mediane der Tausenden von neu abgetasteten Datensätzen die 95% Konfidenzgrenzen für die Mittel- und Median, respectively.

Offensichtlich würden Sie nie versuchen, diese Bootstrapping Prozess von Hand zu tun, aber es ist ziemlich einfach, mit Software wie dem kostenlosen Statistics101 Programm zu tun. Sie können Ihre beobachteten Ergebnisse geben und ihm sagen, sagen wir, 100.000 neu abgetastete Datensätze erzeugen, zu berechnen und den Mittelwert zu speichern und den Median von jedem und dann auf die SD berechnen und die 2.5th und 97,5 Perzentile jener 100.000 Mittel und 100.000 Mediane. Hier sind ein paar Ergebnisse aus einer Bootstrap-Analyse dieser Daten durchgeführt:

Ist-Daten: 61, 88, 89, 89, 90, 92, 93, 94, 98, 98, 101, 102, 105, 108, 109, 113, 114, 115, 120 und 138. Mittelwert = 100.85- Median = 99,5
Neu abgetasteten Daten Set #1: 61, 88, 88, 89, 89, 90, 92, 93, 98, 102, 105, 105, 105, 109, 109, 109, 109, 114, 114 und 120. Mittlere1 = 99,45, Median1 = 103.50
Neu abgetasteten Daten Set #2: 61, 88, 89, 89, 90, 92, 92, 98, 98, 98, 102, 105, 105, 108, 108, 113, 113, 113, 114 und 138. Mittlere2 = 100,7, Median2 = 100,0
(Zwischen Set # 2 und den folgenden Satz, 99.996 mehr Bootstrap-Datensätze generiert wurden.)
Neu abgetasteten Daten Set #99,999: 61, 61, 88, 89, 92, 93, 93, 94, 98, 98, 98, 101, 102, 105, 109, 114, 115, 120, 120 und 138. Mittlere99999 = 99,45, Median99999 = 98,00
Neu abgetasteten Daten Set #100,000: 61, 61, 61, 88, 89, 89, 90, 93, 93, 94, 102, 105, 108, 109, 109, 114, 115, 115, 120 und 138. Mittlere100.000 = 97,7, Median100.000 = 98,0

Hier ist eine Zusammenfassung der 100.000 Resampling:

  • Die SD der 100.000 bedeutens = 3.46- dies ist der Bootstrap SE des mittleren (SEM).

  • Die SD der 100.000 Mediane = 4.24- dies ist der Bootstrap SE des Median.

  • Die 2.5th und 97,5 Perzentile der 100.000 Mittel = 94,0 und 107.6- das sind die Bootstrap 95% Vertrauensgrenzen für die bedeuten.

  • Die 2.5th und 97,5 Perzentile der 100.000 Mediane = 92,5 und 108.5- das sind die Bootstrap 95% Vertrauensgrenzen für die Median.

Also würden Sie Ihren Mittelwert und Median berichten, zusammen mit ihren Bootstrap Standardfehler und 95% Konfidenzintervall auf diese Weise:

Mittelwert = 100.85 # 177- 3.46 (94,0 bis 107,6) - Median = 99,5 # 177- 4.24 (92,5 bis 108,5).

Sie werden feststellen, dass die SE größer (und der CI ist breiter) für den Median als für den Mittelwert. Dies gilt allgemein für normal verteilte Daten - der Median hat etwa 25% mehr als die mittlere Variabilität. Aber für nicht-normalverteilten Daten ist der Median oft genauer als der Mittelwert.

Sie brauchen nicht Bootstrapping für etwas so Einfaches wie die SE oder CI eines Mittel zu verwenden, da es einfache Formeln dafür. Aber die Bootstrap-Methode kann genauso leicht die SE oder CI für einen Median berechnen, einen Korrelationskoeffizienten oder einen pharmakokinetischen Parameter wie die AUC oder Eliminationshalbwertszeit eines Medikaments, für die es keine einfachen SE oder CI Formeln und für die die Normalität Annahmen möglicherweise nicht gelten.

Bootstrapping ist vom Konzept her einfach, aber es ist nicht narrensicher. Das Verfahren beinhaltet bestimmte Annahmen und bestimmte Grenzen gesetzt. Zum Beispiel, es ist wahrscheinlich nicht zu sein sehr nützlich, wenn Sie nur ein paar beobachteten Werte. Auschecken Statistik 101 Weitere Informationen über die Bootstrap-Methode (und für die freie Statistics101 Software, um die Bootstrap-Berechnungen sehr einfach zu tun).

Menü