Wie die Differenz zwischen zwei Proportions zu schätzen

Um die Differenz zwischen zwei Bevölkerungsanteile mit einem Konfidenzintervall abschätzen zu können, können Sie den zentralen Grenzwertsatz verwenden, wenn die Probengrößen sind groß genug (in der Regel, die jeweils mindestens 30). Wenn eine statistische Kenn, wie Meinung zu einem Thema (Unterstützung / nicht unterstützt), der beiden Gruppen verglichen werden, ist kategorisch, Menschen wollen auf die Unterschiede zwischen den beiden Bevölkerungsanteile zu berichten - zum Beispiel die Differenz zwischen dem Anteil der Frauen und Männer, die ein Vier-Tage-Woche unterstützen. Wie machst Du das?

Sie schätzen den Unterschied zwischen zwei Bevölkerungsanteilen, p1 - p2, indem man eine Probe aus jeder Population zu nehmen und die Differenz der zwei Probenanteile verwenden,

image0.png

plus oder minus einem Fehlerspanne. Das Ergebnis wird als ein Konfidenzintervall für die Differenz von zwei unbekannten Proportionen, p1 - p2.

Die Formel für ein Konfidenzintervall (CI) für die Differenz zwischen zwei Populations Proportionen

image1.png

und n1 werden die Probenanteil und Probengröße der ersten Probe und

image2.png

und n2 sind die Stichprobenanteil und Probengröße der zweiten Probe. Der Wert z * ist der entsprechende Wert aus der Standardnormalverteilung für die gewünschte Konfidenzniveau. (Siehe folgende Tabelle für z *-Werte.)

z*-Werte für verschiedene Konfidenzniveaus
Confidence Levelz * -Wert
80%1,28
90%1.645 (von der Konvention)
95%1,96
98%2.33
99%2,58

Um einen CI für die Differenz zwischen zwei Bevölkerungsanteile zu berechnen, gehen Sie wie folgt vor:

  1. Bestimmen Sie die Konfidenzniveau und finden Sie die entsprechende z *-Wert.

    Siehe TO THE Tabelle oben.

  2. Finden Sie die Probe Anteil

    image3.png

    für die erste Probe von der Gesamtanzahl von der ersten Probenentnahme, die in die Kategorie von Interesse und Division durch die Probengröße sind, n1. In ähnlicher Weise finden

    image4.png

    für die zweite Probe.

  3. Nehmen Sie den Unterschied zwischen den Proben Proportionen,

    image5.png
  4. Finden

    image6.png

    und Kluft, die durch n1. Finden

    image7.png

    und Kluft, die durch n2. Fügen Sie diese beiden Ergebnisse zusammen und die Quadratwurzel nehmen.

  5. Multiplizieren z * mal das Ergebnis von Schritt 4.

    Dieser Schritt gibt Ihnen die Fehlermarge.

  6. Nehmen

    image8.png

    plus oder minus der Fehlermarge von Schritt 5, um die CI zu erhalten.

    Das untere Ende des CI ist

    image9.png

    minus die Fehlerquote, und das obere Ende des CI ist

    image10.png

    plus die Fehlerspanne.

Die Formel hier für ein CI gezeigt für p1 - p2unter der Bedingung verwendet, die groß genug für den zentralen Grenzwertsatz beide Größen der Probe sind aufgebracht werden und ermöglichen es Ihnen ein zu verwenden, z* -value- Dies gilt, wenn Sie Proportionen mit großem Maßstab Erhebungen werden Schätzen, zum Beispiel. Für kleine Probengrößen, Konfidenzintervalle sind über den Rahmen eines Kurs Intro Statistiken.

Angenommen, Sie für die Las Vegas Handelskammer arbeiten, und Sie wollen, mit 95% der Differenz zwischen dem Anteil aller Frauen zu schätzen, die jemals gegangen sind ein Elvis-Imitator und den Prozentsatz aller Männer zu sehen, die jemals gegangen sind ein, um zu sehen Elvis-Imitator, um festzustellen, wie Sie Ihr Entertainment-Angebote vermarkten sollte.

  1. Weil Sie ein 95% Konfidenzintervall, Ihre z *-Wert ist 1.96.

  2. Angenommen, Ihre Stichprobe von 100 Frauen umfasst 53 Frauen, die ein Elvis-Imitator gesehen haben, so

    image11.png

    53 von 100 = 0,53 geteilt. Nehmen wir weiter an, dass Ihre Stichprobe von 110 Männern umfasst 37 Männer, die jemals ein Elvis-Imitator gesehen haben, so

    image12.png

    37 von 110 = 0,34 geteilt.

  3. Der Unterschied zwischen diesen Probe Anteilen (Weibchen - Männchen) ist 0,53-0,34 = 0,19.

  4. Nehmen 0,53 # 8727- (1-0,53) zu erhalten 0,2941. Dann teilen Sie, dass durch 100 0.0025 zu bekommen. Dann nehmen Sie 0,34 # 8727- (1-0,34) zu erhalten 0,2244. Dann teilen Sie, dass durch 110 0.0020 zu bekommen. Fügen Sie diese beiden Ergebnisse 0,0025 + 0,0020 = 0,0045 zu erhalten. Dann finden Sie die Quadratwurzel von 0,0045 die 0,0671 ist.

  5. 1,96 # 8727- 0,0671 gibt Ihnen 0,13, oder 13%, was die Fehlerquote ist.

  6. Ihr 95% Vertrauensintervall für die Differenz zwischen dem Anteil der Frauen, die ein Elvis-Imitator und der Prozentsatz der Männer gesehen haben, die ein Elvis-Imitator gesehen haben, ist 0,19 oder 19% (die Sie in Schritt 3 bekam), plus oder minus 13%. Das untere Ende des Intervalls 0,19 - 0,13 = 0,06 bzw. 6% - das obere Ende beträgt 0,19 + 0,13 = 0,32 oder 32%.

    Um diese Ergebnisse im Rahmen des Problems interpretieren, können Sie mit 95% sagen, dass ein höherer Prozentsatz von Frauen als Männer haben ein Elvis-Imitator zu sehen ist, und die Differenz in diesen Prozentsätzen liegt irgendwo zwischen 6% und 32%, bezogen auf Sample.

    Die Versuchung ist zu sagen, # 147-Well, wusste ich, ein größerer Anteil der Frauen, die ein Elvis-Imitator gesehen hat, weil die Probe Anteil 0,53 war und für Männer war es nur 0,34. Warum brauche ich noch ein Konfidenzintervall? # 148- All diese beiden Zahlen erzählen Sie etwas über diese 210 Personen abgetastet wird. Sie müssen auch in Variation zu Faktor die Fehlerquote mit der Lage sein, etwas über die gesamte Bevölkerung von Männern und Frauen zu sagen.

Natürlich gibt es da draußen einige Leute, die sie jemals nicht zugeben würde würde ein Elvis-Imitator gesehen (obwohl sie wahrscheinlich irgendwann tun Karaoke eins zu sein habe tat). Dies kann einige Verzerrung der Ergebnisse erstellen.

Beachten Sie, dass Sie einen negativen Wert erhalten könnte für

image13.png

Zum Beispiel, wenn Sie die Männchen und Weibchen eingeschaltet hatte, würden Sie bekommen -0,19 für diesen Unterschied haben. Das ist in Ordnung, aber man kann, indem man die Gruppe mit dem größeren Stichprobenanteil in den Proben Proportionen negativen Unterschiede zu vermeiden, da die erste Gruppe dienen (hier Frauen).

Doch selbst wenn die Gruppe mit der größeren Stichprobe Anteil wie die erste Gruppe dient, manchmal werden Sie immer noch negative Werte in das Konfidenzintervall zu bekommen. Nehmen wir im obigen Beispiel, dass nur 0,43 von Frauen hatte ein Elvis-Imitator gesehen. Somit ist der Unterschied in Anteilen 0,09, und das obere Ende des Konfidenzintervalls beträgt 0,09 + 0,13 = 0,22, während das untere Ende 0,09 beträgt - 0,13 = -0,04. Dies bedeutet, daß der wahre Unterschied ist vernünftigerweise überall von 22% mehr Frauen bis 4% mehr Männer. Es ist zu nah, um sicher zu sagen.

Menü