Wie Linear Daten mit R auswerten

Natürlich stellt R eine ganze Reihe von verschiedenen Tests und Maßnahmen zu bewerten, wie gut das Modell Ihrer Daten sowie Blick auf die Modellannahmen passt. Auch hier legte die Übersicht ist noch lange nicht abgeschlossen, aber es gibt Ihnen eine Vorstellung davon, was möglich ist, und einen Ausgangspunkt für die Frage schauen tiefer in.

Wie das Modell zusammenfassen

Das Zusammenfassung() Funktion sofort kehrt die F-Test für die Modelle konstruiert mit aov (). Für lm () Modelle, ist dies etwas anders. Werfen Sie einen Blick auf die Ausgabe:

> Model.summary lt; - Zusammenfassung (Modell)> Model.summaryCall: lm (Formel = mpg ~ wt, data = mtcars) Residuen: Min 1Q Median 3Q Max-4,5432 -2,3647 -0,1252 1,4096 6.8727Coefficients: Schätz Std. Fehler t Wert Pr (> | t |) (Intercept) 37,2851 1,8776 19,858 lt; 2e-16 *** wt -5,3445 0,5591 -9,559 1.29e-10 *** --- Signif. Codes: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1Residual Standardfehler: 3,046 auf 30 Grad freedomMultiple R-Quadrat: 0,7528, Adjusted R-Quadrat: 0.7446F-Statistik: 91,38 auf 1 und 30 DF, p-Wert: 1.294e-10

Das ist eine ganze Menge nützlicher Informationen. Hier sehen Sie die folgenden:

  • Die Verteilung der Residuen, die Ihnen eine erste Vorstellung davon, wie gut die Annahmen eines linearen Modells halten, gibt

  • Die Koeffizienten von einem t-Test begleitet, Sie erzählen, wie weit jeder Koeffizient signifikant von Null verschieden

  • Die Güte der Anpassungsmaße R2 und die eingestellte R2

  • Der F-Test, der Ihnen eine Vorstellung darüber gibt, ob Ihr Modell einen erheblichen Teil der Varianz in den Daten erklärt

Sie können die Verwendung koef () Funktion eine Matrix mit den Schätzungen, Standardfehler, und T-Wert und p-Wert für die Koeffizienten aus der Zusammenfassung Objekt wie folgt zu extrahieren:

> Koef (Model.summary) Schätzung Std. Fehler t Wert Pr (> | t |) (Intercept) 37,285126 1,877627 19,857575 8.241799e-19 Gewichts -5,344472 0,559101 -9,559044 1.293959e-10

Wenn diese Bedingungen Sie nichts sagen, schauen sie in eine gute Quelle über die Modellierung auf. Für eine umfassende Einführung in die Anwendung und lineare Modelle richtig zu interpretieren, Check-out Applied Linear Statistische Modelle, 5. Auflage, von Michael Kutner et al (McGraw-Hill / Irwin).

Wie die Auswirkungen der Musterbedingungen zu testen

Um eine Varianzanalyse-Tabelle erhalten - wie die Zusammenfassung() Funktion sorgt für eine ANOVA-Modell - Sie verwenden einfach die anova () Funktion und übergeben sie die lm () Modell-Objekt als Argument, wie folgt aus:

> Model.anova lt; - Anova (Modell)> Model.anovaAnalysis Varianz TableResponse: mpgDf Summe Sq Mittlere Sq F-Wert Pr (> F) wt 1 847,73 847,73 91,375 1.294e-10 *** Residuen 30 278,32 9,28 --- Signif. Codes: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1

Hier ist das resultierende Objekt ein Datenrahmen, die Sie einen beliebigen Wert aus dieser Tabelle sind die subsetting und Indizierung Tools zu extrahieren. Um zum Beispiel den p-Wert zu erhalten, können Sie folgendes tun:

> Model.anova [ 'wt', 'Pr (> F)'] [1] 1.293959e-10

Sie können diesen Wert als die Wahrscheinlichkeit zu interpretieren, die die Variable Hinzufügen wt zum Modell keinen Unterschied machen. Der niedrige p-Wert zeigt sich hier, dass das Gewicht eines Autos (wt) Erläutert einen wesentlichen Teil des Unterschieds der Kilometerleistung (mpg) Zwischen den Autos. Dies sollte nicht kommen als Überraschung- ein schwerer Auto tut, ja, mehr Leistung benötigen ihr eigenes Gewicht um zu schleppen.

Sie können die Verwendung anova () Funktion verschiedene Modelle zu vergleichen, wie gut, und viele Modellierungs Pakete bieten diese Funktionalität. Sie finden Beispiele dafür auf den meisten der im Zusammenhang mit Hilfeseiten wie ?anova.lm und ?anova.glm.

Menü