Wie man Daten analysieren Varianzen mit R in Models

Eine Varianzanalyse (ANOVA) ist eine sehr übliche Technik mit R verwendet, um die Mittel zwischen verschiedenen Gruppen von Daten zu vergleichen. Um dies zu verdeutlichen, werfen Sie einen Blick auf den Datensatz Insektenspray

:

> Str (InsectSprays) 'data.frame': 72 obs. von 2 Variablen: $ count: num 7 20 14 10 14 12 10 23 17 20 ... $ Spray: Faktor w / 6 Ebenen "A", "B", "C", "D", ..: 1 1 1 1 1 1 1 1 1 1 ...

Dieser Datensatz enthält die Ergebnisse eines landwirtschaftlichen Experiment. Sechs Insektizide wurden auf 12 Feldern getestet je und die Forscher gezählt, um die Anzahl von lästigen Bugs, die auf jedem Feld geblieben. Nun müssen die Bauern wissen, ob die Insektizide keinen Unterschied machen, und wenn ja, welche sie optimal zu nutzen. Sie beantworten diese Frage durch die Verwendung von aov () Funktion eine ANOVA durchzuführen.

Wie das Modell zu bauen

Für dieses einfache Beispiel der Erstellung des Modells ist ein Stück Kuchen. Sie wollen im wesentlichen die Mittel für die Variable zu modellieren Graf als eine Funktion der variablen sprühen. Sie übersetzen, das zu R wie folgt aus:

> AOVModel lt; - aov (Zählung ~ Spray, data = InsectSprays)

Sie übergeben zwei Argumente an die aov () Funktion in dieser Codezeile:

  • Die Formel zählen ~ Spray, Wortlaut # 147-count als Funktion der Spray # 148;

  • Das Argument Daten, wo man die Variablen in der Formel angeben, in der die Datenrahmen gefunden werden kann,

Jede Modellierungsfunktion gibt ein Modellobjekt mit einer Vielzahl von Informationen über das angepasste Modell. Setzen Sie stets dieses Modellobjekt in einer Variablen. Auf diese Weise müssen Sie sich nicht um das Modell wieder anbringen, wenn Sie zusätzliche Berechnungen durchführen müssen.

Wie am Modellobjekt zu suchen

Wie bei jedem Objekt können Sie bei einem Modellobjekt aussehen nur durch seinen Namen in der Konsole eingeben. Wenn Sie das tun, für das Objekt Modell dass Sie erstellt haben, sehen Sie die folgende Ausgabe:

> AOVModelCall: aov (Formel = count ~ Spray, data = InsectSprays) Ausdrücke: ResidualsSum der Quadrate 2668,833 1015.167Deg sprühen. Standardfehler der Freedom566Residual: 3.921902Estimated Effekte können unausgeglichen

Dies bedeutet nicht, dass viel sagen, abgesehen von dem Befehl (oder der Anruf) Verwendet, das Modell und einige grundlegende Informationen über das Anpassungsergebnis zu bauen.

In der Ausgabe lesen Sie auch, dass die geschätzten Auswirkungen unausgeglichen sein kann. Dies ist keine Warnung - es ist eine Botschaft, die in vom Autor des errichtet wird aov () Funktion. Dieser kann in zwei Situationen auftauchen:

  • Sie haben nicht die gleiche Anzahl von Fällen, in jeder Gruppe.

  • Sie haben nicht festgelegt orthogonale Kontraste.

In diesem Fall ist es der zweite Grund.

Menü