Hinweise zum Umgang mit Vielfalt in der Daten aus klinischen Studien

Jedes Mal, wenn eine statistische Signifikanz-Test durchführen, führen Sie eine Chance, in das Denken von zufälligen Schwankungen getäuscht, dass einige echte Wirkung in den Daten vorhanden ist, wenn in der Tat keiner vorhanden ist.

Dieses Szenario wird als ein Typ-I-Fehler. Wenn Sie sagen, dass Sie p benötigen lt; 0,05 für Bedeutung, sind Testen Sie bei 0,05 (oder 5 Prozent) alpha-Niveau oder sagen, dass Sie Ihre Typ-I-Fehlerrate auf 5 Prozent zu begrenzen wollen. Aber das 5 Prozent Fehlerquote gilt für jeden statistischen Test, den Sie ausführen.

Je mehr Analysen, die Sie auf einem Datensatz ausführen, desto mehr wird Ihr Gesamt Alpha-Niveau erhöht: Führen Sie zwei Tests und Ihre Chance auf zumindest einer von ihnen kommen aus fälschlicherweise von Bedeutung ist etwa 10 Prozent- 40 Tests durchgeführt, und die gesamte Alpha-Niveau springt auf 87 Prozent. Dies wird als das Problem der multiplicichty, oder als Typ-I-Fehler Inflation.

Einige statistische Methoden multiple Vergleiche beteiligt (wie Post-hoc-Tests nach einer ANOVA für mehrere Gruppen zu vergleichen) verfügen über eine integrierte in Anpassung an die Gesamt Alpha zu halten nur 5 Prozent über alle Vergleiche. Aber, wenn Sie verschiedene Hypothesen zu testen sind, wie verschiedene Variablen zu verschiedenen Zeitpunkten zwischen den verschiedenen Gruppen zu vergleichen, ist es an Ihnen zu entscheiden, welche Art von Alpha-Steuerstrategie (falls vorhanden) Sie implementieren möchten.

Sie haben mehrere Möglichkeiten, darunter die folgenden:

  • Nicht steuern für Vielfalt und akzeptieren Sie die Wahrscheinlichkeit, dass einige Ihrer "signifikant" Ergebnisse werden fälschlicherweise von Bedeutung sein. Diese Strategie wird oft mit Hypothesen im Zusammenhang mit sekundären und explorato verwendet Objektive- in der Regel das Protokoll besagt, dass keine endgültigen Schlüsse aus diesen Sondierungstests vorgenommen werden. Alle "signifikant" Ergebnisse werden nur "Signale" der möglichen realen Effekte in Betracht gezogen werden und muss in nachfolgenden Studien bestätigt werden, bevor endgültige Schlussfolgerungen gezogen werden.

  • Kontrollieren Sie die Alpha-Ebene nur über die wichtigsten Hypothesen. Wenn Sie zwei co-primären Ziele haben, können Sie Alpha über die Tests auf diese beiden Ziele zu steuern.

    Sie können Alpha bis 5 Prozent (oder auf jeder Ebene Sie wollen) steuern kann für eine Reihe von n Hypothesentests in mehreren Möglichkeiten-folgen einige populären:

  • Die Bonferroni Einstellung: Testen Sie jede Hypothese am 0.05 /n Alpha-Niveau. Also insgesamt Alpha bis 0,05 über zwei primären Endpunkte zu steuern, müssen Sie p lt; 0,025 für Bedeutung bei der Prüfung jedes einzelnen.

  • Eine hierarchische Teststrategie: Rang Ihre Endpunkte in der Reihenfolge ihrer Bedeutung. Testen Sie das wichtigste zuerst, und wenn es p gibt lt; 0,05, dem Schluss, dass der Effekt ist real. Dann testen Sie die nächste wichtigste, wieder p mit lt; 0,05 für Bedeutung.

    Weiter, bis Sie eine nicht signifikante Ergebnis zu erhalten (p> 0,05) - dann aufhören zu testen (oder alle weiteren Tests betrachten sie als nur explorativen und zeichne keine formellen Schlussfolgerungen über sie).

  • Die Steuerung der falschen Entdeckung Rate (FDR): Dieser Ansatz hat in den letzten Jahren populär geworden mit großen Vielzahl umgehen, die in Bereichen wie genomischen Test- und digitale Bildanalyse ergibt sich, dass viele Tausende von Tests (wie beispielsweise eine pro-Gen oder einem pro Pixel) anstelle von nur wenigen umfassen kann .

    Anstatt selbst eine zu vermeiden versuchen, Single Trugschluss von Bedeutung (wie der Bonferroni und andere klassische Alpha Kontrollmethoden tun), können Sie einfach zu steuern wollen, dass die Anteil von Tests, die falsch positiv herauskommen, dass falsche Entdeckung Rate bis zu einem gewissen angemessener Anteil aller Tests zu begrenzen. Diese positiven Ergebnisse können dann in einer Follow-up-Studie getestet werden.

Menü