Wie man ein Konfidenzintervall für die Differenz von zwei Mittel erstellen mit unbekannten Standardabweichungen und / oder kleine Probengrößen

Sie können ein Konfidenzintervall (CI) für den Unterschied zwischen dem Mittel oder Mittelwerte von zwei unbekannten Proben zu finden, auch wenn die Standardabweichungen unbekannt sind und / oder die Stichprobengrößen sind klein. Das Ziel vieler statistischen Erhebungen und Studien ist zwei Populationen zu vergleichen, wie Männer im Vergleich zu Frauen, niedrig im Vergleich zu Familien mit hohem Einkommen, und die Republikaner gegen Demokraten. Wenn das Merkmal verglichen wird numerisch ist (zB Größe, Gewicht, oder Einkommen), ist das Objekt des Interesses der Betrag der Differenz in den Mitteln (Mittelwerte) für die beiden Populationen.

Zum Beispiel können Sie den Unterschied im Durchschnittsalter der Republikaner gegen Demokraten, oder den Unterschied in der durchschnittlichen Einkommen von Männern im Vergleich zu Frauen zu vergleichen. Sie schätzen den Unterschied zwischen zwei Bevölkerung bedeutet,

image0.png

indem man eine Probe aus jeder Population nimmt (beispielsweise Probe 1 und Probe 2) und mit der Differenz der beiden Probenmittel

image1.png

plus oder minus einem Fehlerspanne. Das Ergebnis ist ein Konfidenzintervall für die Differenz von zwei unbekannten Mittel,

image2.png

Es gibt zwei Situationen, in denen Sie nicht z * verwenden können, wenn das Vertrauensintervall berechnet wird. Von denen die erste ist, wenn man nicht weiß,

image3.png

In diesem Fall müssen Sie sie mit den Probenstandardabweichungen zu schätzen, s1 und s2. Die zweite Situation ist, wenn die Probengrößen sind klein (weniger als 30). In diesem Fall können Sie nicht sicher sein, ob Ihre Daten aus einer Normalverteilung kam.

In beiden Situationen bedeutet ein Konfidenzintervall für die Differenz in den beiden Bevölkerung

image4.png

woher t * ist der kritische Wert aus der t-Verteilung mit n1 + n2 - 2 Grad von freiheits n1 und n2sind die beiden Probengrößen, respectively- und s1und s2sind die beiden Stichproben-Standardabweichungen. Dies t *-Wert wird auf der folgenden gefunden t-Tabelle durch die Zeile für sich schneid df = n1 + n2 - 2 mit der Spalte für das Konfidenzniveau Sie müssen wie angegeben, durch in der letzten Zeile der Tabelle suchen.

image5.jpg

Um einen CI für die Differenz zwischen zwei Bevölkerungsmittel berechnen, gehen Sie wie folgt vor:

  1. Bestimmen Sie die Vertrauensniveau und Freiheitsgraden (n1 + n2 - 2) und finden Sie die entsprechende t *-Wert.

    Siehe den abovetable.

  2. Identifizieren

    image6.png

    Identifizieren

    image7.png
  3. Finde den Unterschied,

    image8.png

    zwischen den Probenmittel.

  4. Berechnen Sie das Konfidenzintervall unter Verwendung der Gleichung,

    image9.png

Angenommen, Sie mit 95% der Differenz zwischen den Mittelwert (Durchschnitt) Längen der Cobs von zwei Sorten von Mais zu schätzen wollen (so dass sie die gleiche Anzahl von Tagen unter den gleichen Bedingungen zu wachsen). Rufen Sie die beiden Sorten Mais-e-Statistiken (Gruppe 1) und Statistik-o-süß (Gruppe 2). Angenommen, Sie haben nicht die Standardabweichungen nicht kennen, so dass Sie verwenden, um die Probe Standardabweichungen statt - nehme an, sie erweisen sich als s1 = 0,40 und s2 = 0,50 Zoll, respectively. Nehmen wir an, die Stichprobengrößen, n1 und n2, sind jeweils nur 15.

  1. Um die CI zu berechnen, müssen Sie zuerst das zu finden t * -Wert auf die t-Verteilung mit (15 + 15 - 2) = 28 Freiheitsgrade. Unter Verwendung des obigen t-Tisch, schauen Sie auf der Zeile für 28 Freiheitsgrade und die Säule mit einem Konfidenzniveau von 95% entspricht (die Etiketten auf der letzten Zeile der Tabelle) - schneiden sie und Sie sehen, t *28 = 2,048.

  2. Für beide Gruppen nahmen Sie Stichprobe von 15 Cobs, mit dem Corn-e-Statistiken Vielzahl von durchschnittlich 8,5 Zoll und Statistik-o-süß 7,5 Zoll. So ist die Informationen, die Sie haben, ist:

    image10.png
  3. Der Unterschied zwischen den Stichprobenmittel

    image11.png

    ist 8,5 bis 7,5 = 1 Zoll. Dies bedeutet den Durchschnitt für Corn-e-Statistiken minus den Mittelwert für Statistik-o-süß ist positiv, so dass Mais-e-Statistiken, die größere der beiden Sorten in Bezug auf dieses Beispiel. Ist dieser Unterschied genug, um die gesamte Bevölkerung zu verallgemeinern, wenn? Das ist, was dieses Konfidenzintervall helfen wird Sie sich entscheiden.

  4. Mit dem Rest der Informationen, die Sie gegeben sind, finden Sie das Konfidenzintervall für den Unterschied in der mittleren cob Länge für die beiden Marken:

    image12.png

    Ihr 95% Vertrauensintervall für die Differenz zwischen den durchschnittlichen Längen für diese beiden Sorten von Mais ist 1 Zoll, plus oder minus 0,9273 Zoll. (Das untere Ende des Intervalls ist 1-,9273 = 0. 0727 Zoll- das obere Ende ist 1 + 0 9273 = 1. 9273 Zoll.) Beachten Sie alle Werte in diesem Intervall positiv sind. Das bedeutet, Corn-e-Statistiken wird geschätzt, dass sie länger als Statistik-o-süß, auf der Grundlage Ihrer Daten.

    Die Versuchung ist zu sagen, # 147-Well, wusste ich, Corn-e-Statistiken Mais war länger, weil seine Probe Mittelwert betrug 8,5 Zoll und Stat-o-süß war nur 7,5 Zoll im Durchschnitt. Warum brauche ich noch ein Konfidenzintervall? # 148- All diese beiden Zahlen erzählen Sie etwas über diese 30 Ähren ist abgetastet. Sie müssen auch in Variation zu Faktor die Fehlerquote mit der Lage sein, etwas über die gesamte Bevölkerung von Mais zu sagen.

Menü