Die Macht eines statistischen Hypothesentest

Die Leistung eines statistischen Tests ist die Chance, dass es kommen wird statistisch signifikant, wenn es sein sollte - das heißt, wenn die alternative Hypothese wirklich wahr ist. Kraft ist eine Wahrscheinlichkeit und wird sehr häufig als ein Prozentsatz ausgedrückt. Beta ist die Chance auf eine nicht signifikante Ergebnis zu erzielen, wenn die alternative Hypothese wahr ist, so dass Sie die Macht und Beta sehen sind im Zusammenhang mathematisch: Power = 1 - beta.

Die Leistung der statistischen Test hängt von mehreren Faktoren ab:

  • Die Alpha-Ebene, die Sie für den Test festgestellt haben - das ist die Chance, dass Sie bereit sind, ist, zur Herstellung einer Typ-I-Fehler zu akzeptieren

  • Die tatsächliche Größe des Effekts in der Bevölkerung, bezogen auf die Menge von Rauschen in dem Daten

  • Die Größe der Probe

Macht, Stichprobengröße, Effektgröße in Bezug auf Lärm und Alpha-Ebene können nicht alle variiert werden independently- sie sind miteinander verknüpft - die vier Mengen durch eine mathematische Beziehung Beteiligung verbunden und eingeschränkt.

Diese Beziehung ist oft sehr kompliziert, und manchmal kann es nicht explizit als Formel niedergeschrieben werden, aber es existiert. Für eine bestimmte Art von Test, können Sie (zumindest theoretisch) zu bestimmen, eine der vier Mengen, wenn Sie die anderen drei kennen. So gibt es vier verschiedene Möglichkeiten, Leistungsberechnungen zu tun, mit jeder Art von willkürlich festgelegten Werte der anderen drei eine der vier Mengen zu berechnen.

Macht, Stichprobengröße und Wirkung Größenverhältnisse

Der Alpha-Level eines statistischen Tests wird in der Regel auf 0,05, eingestellt, sofern keine besonderen Überlegungen. Nachdem Sie den Wert von Alpha angeben, können Sie auf verschiedene Weise die Beziehung zwischen den anderen drei Variablen (Leistung, Stichprobengröße und Effektgröße) angezeigt werden:

  • Leistung über der Stichprobengröße für verschiedene Effektgrößen: Für alle statistischen Tests, Macht einlWegen zunimmt, wenn die Probengröße zunimmt, wenn andere Dinge (wie Alpha-Level und Effektgröße) konstant gehalten werden. "Eff" ist der Effektgröße - der Unterschied zwischen den Gruppen durch die innerhalb der Gruppe Standardabweichung geteilt.

    Sehr kleine Proben produzieren nur selten signifikante Ergebnisse, es sei denn der Effekt sehr groß ist. Im Gegensatz dazu extrem große Proben (viele tausend Probanden) sind fast immer signifikant, wenn die Effektgröße in der Nähe von Null ist. In epidemiologischen Studien, die häufig Hunderte von Tausenden von Subjekten umfassen, neigen statistische Tests äußerst gering zu erzeugen (und somit extrem signifikante) p-Werte, auch wenn die Effektgröße so klein ist, dass es keine praktische Bedeutung ist.

    bild0.jpg
  • Leistung über Effektgröße, für verschiedene Stichprobengrößen: Für alle statistischen Tests, Macht immer, dass ichnFalten wie die Effektgröße zunimmt, wenn andere Dinge (wie Alpha-Ebene und Stichprobengröße) konstant gehalten werden. "N" ist die Zahl der Patienten in jeder Gruppe.

    Für sehr große Effektstärken, nähert sich die Leistung 100 Prozent. Für sehr kleine Effektgrößen, könnte man denken, die Macht des Tests gegen Null gehen würde, aber man kann aus der Figur zu sehen, dass es nicht den ganzen Weg geht hinunter zum Null- es die Alpha-Ebene des Tests tatsächlich nähert.

    (Beachten Sie, dass das Alpha-Niveau des Tests ist die Wahrscheinlichkeit des Tests ist ein signifikantes Ergebnis zu erzeugen, wenn kein Effekt wirklich vorhanden ist.)

    image1.jpg
  • Probengröße im Vergleich zu Effektgröße für verschiedene Werte der Macht: Für alle statistischen Tests, Probengröße und Effektgröße sind in umgekehrter Beziehung, wenn andere Dinge (wie Alpha-Niveau und Leistung) konstant gehalten werden. Kleine Effekte können nur mit großen samples- große Effekte nachgewiesen werden können oft mit kleinen Proben nachgewiesen werden.

    image2.jpg

    Diese inverse Beziehung zwischen Probengröße und Effektgröße nimmt eine sehr einfache mathematische Form (zumindest in guter Näherung): Die erforderliche Stichprobengröße zum Quadrat der Effektgröße umgekehrt proportional ist, die detektiert werden kann.

    Oder äquivalent ist der nachweisbare Wirkung Größe umgekehrt proportional zur Quadratwurzel der Stichprobengröße. Also, Größe Vervierfachung Ihre Probe ermöglicht es Ihnen, Effektgrößen nur halb so groß zu erkennen.

Wie zu tun, Leistungsberechnungen

Leistungsberechnungen sind ein wichtiger Teil der Gestaltung eines Forschungsprojekts. Sie wollen nicht Ihre Studie (mit einem hohen Risiko der fehlenden tatsächlichen Auswirkungen) oder überwältigt (größer, teurer und zeitaufwendiger als nötig) untermotorisiert zu sein. Sie benötigen einen Strom- / Sample-Größe Analyse für alle Forschungsvorhaben, die Sie für die Finanzierung oder einem Protokoll Sie zu einem Review Board zur Genehmigung vorlegen muss.

Sie können Leistungsberechnungen auf verschiedene Arten durchführen:

  • Computer Software: Die größeren Statistikpakete (wie SPSS, SAS und R) bieten eine breite Palette von Leistungsberechnungen. Es gibt auch Programme speziell für diesen Zweck konzipiert (nQuery, StatExact, Kraft und Präzision, PS-Power Probengröße und GPower, zum Beispiel).

  • Webseiten: Viele der häufigsten Leistungsberechnungen können online durchgeführt werden unter Verwendung von Web-basierten Rechner. Eine große Sammlung von diesen finden Sie unter StatPages.net.

  • Tragbare Geräte: Apps für den häufigeren Leistungsberechnungen sind für die meisten Tablets und Smartphones zur Verfügung.

  • Gedruckte Grafiken und Tabellen: Sie können Diagramme und Tabellen in den Lehrbüchern zu finden. Diese sind ideal für schnelle und schmutzige Berechnungen.

  • Faustregeln: Einige ungefähre Probengröße Berechnungen sind einfach genug, auf ein Stück Papier zu tun, oder sogar in Ihrem Kopf!

Menü