Wie zu Modell Linear Datenbeziehungen mit R

Eine Analyse der Varianz für die Daten können auch als geschrieben werden lineare Modell

in R, wo Sie einen Faktor als Prädiktor Variable verwenden, um eine Antwortvariable zu modellieren.

Natürlich kann auch, Prädiktorvariablen kontinuierlichen Variablen sein. Zum Beispiel hat das Gewicht eines Autos offensichtlich einen Einfluß auf die Laufleistung. Aber es wäre schön, eine Vorstellung über die Größe dieser Einfluss zu haben. Im Grunde wollen Sie die Gleichung zu finden, die die Trendlinie darstellt. Sie finden die Daten, die Sie in den Datensatz zur Überprüfung dieses benötigen mtcars.

image0.png

Wie ein lineares Modell zu bauen

Das lm () Funktion ermöglicht es Ihnen, alles von der einfachsten linearen Modell für komplexe Interaktionsmodelle zu spezifizieren.

Um die Laufleistung in Abhängigkeit vom Gewicht eines Autos modellieren, verwenden Sie die lm () Funktion, wie folgt aus:

> Modell lt; - lm (mpg ~ wt, data = mtcars)

Sie liefern zwei Argumente:

  • Eine Formel, die das Modell beschreibt: Hier modellieren Sie die Variable mpg als eine Funktion der variablen wt.

  • Ein Datenrahmen, die die Variablen in der Formel: Hier verwenden Sie den Datenrahmen mtcars.

Sie können viele komplexe Modelle mit der Formel-Schnittstelle angeben, wenn Sie Ihren Weg wissen.

Das resultierende Objekt ist eine Liste mit einer sehr komplexen Struktur, aber in den meisten Fällen brauchen Sie nicht zu befürchten, dass. Das Model-Objekt enthält eine Vielzahl von Informationen, die für die Berechnungen der Diagnostik und neue Prognosen benötigt wird.

Wie Informationen aus dem Modell zu extrahieren

Statt des Tauchens in das Modell Objekt selbst und die Informationen irgendwo in der Liste Objekt zu finden, können Sie einige Funktionen, die Ihnen helfen, die notwendigen Informationen aus dem Modell zu bekommen. Zum Beispiel können Sie einen benannten Vektor mit den Koeffizienten aus dem Modell extrahieren die Verwendung von koef () Funktion, wie folgt aus:

> coef.Model lt; - Koef (Modell)> coef.Model (Intercept) wt37.285126 -5,344472

Diese Koeffizienten stellen den Schnittpunkt und die Steigung der Trendlinie. Damit können Sie die Trendlinie auf einem Streudiagramm der Daten zu plotten. Sie tun dies in zwei Schritten:

  1. Sie zeichnen das Streudiagramm mit den Daten.

    Sie verwenden die Grundstück() Funktion dafür.

  2. Sie verwenden die abline () Funktion der Trendlinie auf den Koeffizienten basiert zu ziehen.

Der folgende Code gibt Ihnen die Handlung:

> Grundstück (mpg ~ wt, data = mtcars)> abline (a = coef.Model [1], b = coef.Model [2])

Das abline () Streit ein stellt den Schnittpunkt, und b stellt die Steigung der Trendlinie, die Sie darstellen möchten. Sie zeichnen eine vertikale Linie durch das Argument Einstellung v zum Schnittpunkt mit der x-Achse statt. Horizontale Linien werden durch Setzen des Arguments aufgetragen v zum Schnittpunkt mit der y-Achse.

Im Folgenden finden Sie eine Übersicht über die Funktionen selbst Informationen aus dem Modellobjekt zu extrahieren. Diese Funktionen arbeiten mit verschiedenen Modellobjekten, einschließlich derjenigen, gebaut von aov () und lm ().

Viele Paket Autoren bieten auch die gleichen Funktionen für die Modelle durch die Funktionen in ihrem Paket gebaut. So können Sie immer versuchen, diese Extraktionsfunktionen in Kombination mit anderen Funktionen Modell als auch zu verwenden.

FunktionWas es macht
koef ()Gibt einen Vektor mit den Koeffizienten aus dem Modell
confint ()Liefert eine Matrix mit der oberen und unteren Grenze des theconfidence Intervall für jeden Koeffizienten des Modells
tailliert()Gibt einen Vektor mit den angepassten Werte für everyobservation
Residuen ()Gibt einen Vektor mit den Residuen für jede Beobachtung
vcov ()Liefert die Varianz-Kovarianzmatrix für den Koeffizienten

Menü