Wie bei Data Margen und Anteile in R-Look

In kategorische Datenanalyse verwenden viele R Techniken der Randsummen

der Tabelle in den Berechnungen. Die Randsummen sind die Gesamtzahl der Fälle, über die Kategorien von Interesse. Zum Beispiel würde die Randsummen für Verhalten die Summe über die Zeilen der Tabelle, trial.table.

So fügen Sie Ränder an den Tisch

R können Sie eine Tabelle mit den Randsummen der Zeilen und Spalten in einem einfachen Befehl zu verlängern. Dazu verwenden Sie die addmargins () Funktion, wie folgt aus:

> Addmargins (trial.table) krank gesund Sumrisk 349 43no_risk 11 32 43Sum45 41 86

Sie können auch die Margen für nur eine Dimension hinzufügen, indem Sie die Angabe Marge Argument für die addmargins () Funktion. Zum Beispiel, um nur die Rand zählt für das Verhalten zu bekommen, tun Sie Folgendes:

> Addmargins (trial.table, Marge = 2) krank gesund Sumrisk 349 43no_risk 11 32 43

Das Marge Argument eine Zahl oder einen Vektor von Zahlen, aber es kann ein wenig verwirrend sein. Die Ränder werden auf die gleiche Weise wie in den numerierten apply () Funktion. Damit 1 steht für Zeilen und 2 für Spalten. Um die Spalte Rand hinzuzufügen, müssen Sie festlegen, Marge nach 2, aber diese Spalte Marge enthält die Zeilensummen.

Wie berechnen Proportionen

Sie können sehr mit Proportionen eine Tabelle mit Zählungen in eine Tabelle konvertieren die leicht mit prop.table () Funktion. Dies funktioniert auch bei Mehrweg-Tabellen. Wenn Sie die Proportionen der Beobachtungen in jeder Zelle der Tabelle auf die Gesamtzahl der Fälle wissen wollen, tun Sie einfach folgendes:

> Prop.table (trial.table) krank healthyrisk 0,3953488 0.1046512no_risk 0,1279070 0,3720930

Dies sagt Ihnen, dass zum Beispiel 10,4 Prozent der Menschen in der Studie waren gesund, auch wenn sie das Risikoverhalten zeigte.

Wie Proportionen über Spalten und Zeilen zu berechnen

Aber was, wenn Sie, welcher Anteil der Menschen mit Risikoverhalten wissen wollen, krank? Dann haben Sie nicht die Proportionen berechnen müssen von den Grafen von der Gesamtzahl der Fälle für die ganze dataset- Teilung statt, teilen Sie die Zählungen von den Randsummen.

R können Sie dies tun, sehr einfach mit, wieder, die prop.table () Funktion, aber dieses Mal die Angabe Marge Streit.

Werfen Sie einen Blick auf die Tabelle erneut. Sie möchten die Proportionen über jede Zeile zu berechnen, da jede Zeile eine Kategorie von Verhalten darstellt. Also, die richtigen Proportionen zu erhalten, geben Sie margin = 1 so was:

> Prop.table (trial.table, Marge = 1) krank healthyrisk 0,7906977 0.2093023no_risk 0,2558140 0,7441860

In jeder Zeile, summieren sich die Anteile auf 1. Jetzt können Sie sehen, dass 79 Prozent der Menschen zeigt, Risikoverhalten wurde krank. Nun, es ist nicht große Neuigkeit, dass riskantes Verhalten Krankheiten verursachen können, und die im letzten Ergebnispunkt gezeigten Anteilen in dieser Richtung.

Doch glauben Sie Wissenschaftler nur, wenn Sie es in einer objektiveren Weg zurück können. Das ist der Punkt, an dem Sie sollten dabei einige statistische Tests prüfen.

Menü