So Analysieren von Daten in Tabellen mit R

Sie können R verwenden prop.test ()

Menu

Funktion für Daten in Matrizen und Tabellen. Für prop.test (), diese Tabellen brauchen zwei Spalten mit der Anzahl der Zählwerte für die beiden möglichen Ergebnisse zu haben.

Wie Kontingenz Tabellen zu testen

Alternativ können Sie mit dem chisq.test () Funktion zu analysieren, Tabellen mit einem Chi-Quadrat (# 967-2) Notfalltest. Um dies zu tun auf der Matrix mit den Sitzgurt Daten, tun Sie einfach folgendes:

> Chisq.test (seatbelt.table)

Dies gibt die folgende Ausgabe:

 Pearson-Chi-Quadrat-Test mit Yates 'Kontinuität correctiondata: survivorsX-squared = 24,3328, df = 1, p-Wert = 8.105e-07

Die Werte für die Statistik (X-squared), Die Freiheitsgrade, und der p-Wert sind genau die gleichen wie bei der prop.test () Funktion. Das ist zu erwarten, da - in diesem Fall, zumindest - beide Tests äquivalent sind.

Wie zu testen Tabellen mit mehr als zwei Spalten

im Gegensatz zu den prop.test () Funktion, die chisq.test () Funktion kann mit Tabellen mit mehr als zwei Spalten umgehen und sogar mit mehr als zwei Dimensionen. Um dies zu verdeutlichen, lassen Sie uns am Tisch einen Blick HairEyeColor. Sie können ihre Struktur mit dem folgenden Code sehen:

> Str (HairEyeColor) Tabelle [1: 4, 1: 4, 1: 2] 53 10 3 32 11 50 10 30 10 25 ...- attr (* "dimnames") = Liste der 3 .. $ Haare: chr [1: 4] "Black" "Brown" "Rot" "Blond" .. $ Eye: chr [1: 4] "Brown" "Blue" "Hazel" "Green" .. $ Geschlecht: chr [1: 2] "Male" "Female"

So wird die Tabelle HairEyeColor hat drei Dimensionen: eine für die Haarfarbe, ein für die Augenfarbe und eine für Sex. Die Tabelle zeigt die Verteilung dieser drei Merkmale unter 592 Studenten.

Die Dimension Namen einer Tabelle werden in einem Attribut gespeichert genannt dimnames. Wie Sie aus dem Ausgang des siehe str () Funktion, das ist eigentlich eine Liste mit den Namen für die Zeilen / Spalten in jeder Dimension. Wenn diese Liste eine benannte Liste ist, werden die Namen verwendet, um die Dimensionen zu beschriften. Sie können die Verwendung dimnames () Funktion zu extrahieren oder die Dimensionsnamen ändern.

Um zu überprüfen, ob der Haarfarbe und Augenfarbe verwandt sind, können Sie die Tabelle in den ersten zwei Dimensionen reduzieren die Verwendung von margin.table () Funktion zu Haar- und Augenfarbe für beide Geschlechter zusammenfassen. Diese Funktion summiert die Werte in einigen Dimensionen Sie eine Übersichtstabelle mit weniger Dimensionen zu geben. Dafür müssen Sie die Ränder Sie festlegen, behalten möchten.

Also, um die Tabelle der Haar- und Augenfarbe zu erhalten, verwenden Sie die folgenden Schritte aus:

> HairEyeMargin lt; - margin.table (HairEyeColor, margin = c (1,2))> HairEyeMarginEyeHair Braun Blau Hazel grünschwarz 68 20 15 5Brown 119 84 54 29Red 26 17 14 14Blond 7 94 10 16

Jetzt können Sie einfach überprüfen, ob Haar- und Augenfarbe beziehen, indem sie auf dieser Tabelle zu testen:

> Chisq.test (HairEyeMargin) Pearson Chi-Quadrat-Testdaten: HairEyeMarginX-squared = 138,2898, df = 9, p-Wert lt; 2.2E-16

Wie erwartet, sagt Ihnen die Ausgabe dieser Test, dass einige Kombinationen von Haar- und Augenfarbe häufiger als andere sind. Keine große Überraschung, aber Sie können diese Techniken auf andere, interessante Forschungsfragen verwenden.

Menü