Wie man Predict Werte Neue Daten mit R

Neben der Beschreibung Beziehungen, Modelle können auch verwendet werden, um Werte für neue Daten zu prognostizieren. Dafür verwenden viele Modellsysteme in R die gleiche Funktion, bequem aufgerufen vorhersagen()

Menu

. Jedes Modellierungsparadigma in R hat die Funktion, mit seinem eigenen Geschmack vorherzusagen, aber die grundlegende Funktionalität ist die gleiche für alle von ihnen im Allgemeinen.

Wie die Datenwerte zu erhalten

Zum Beispiel hat ein Autohersteller drei Entwürfe für ein neues Auto und will wissen, was die vorhergesagte Laufleistung auf das Gewicht jedes neue Design basiert. Um dies zu tun, erstellen Sie zuerst einen Datenrahmen mit den neuen Werten - zum Beispiel wie folgt aus:

> new.cars lt; - data.frame (wt = c (1,7, 2,4, 3,6))

Achten Sie darauf, die Variablennamen Sie verwenden, sind die gleichen wie im Modell verwendet. Wenn Sie das tun, rufen Sie einfach die vorhersagen() Funktion mit den geeigneten Argumente, wie folgt aus:

> Vorhersagen (Modell, newdata = new.cars) 12328,19952 24,45839 18,04503

So hat das leichteste Auto eine vorhergesagte Fahrleistung von 28,2 Meilen pro Gallone und der schwerste Auto hat eine vorhergesagte Fahrleistung von 18 Meilen pro Gallone, nach diesem Modell. Natürlich, wenn Sie ein unzureichendes Modell verwenden, können Sie Ihre Prognosen ab, als auch ziemlich viel sein.

Das Vertrauen in Ihre Vorhersagen

Um eine Vorstellung über die Genauigkeit der Vorhersagen zu haben, können Sie für Abständen um Ihre Vorhersage fragen. Um eine Matrix mit der Vorhersage zu bekommen und ein 95 Prozent Konfidenzintervall um den Mittelwert Vorhersage, setzen Sie das Argument Intervall nach 'Vertrauen' so was:

vorhersagen> (Modell, newdata = new.cars, Intervall = 'Vertrauen') fit lwr UPR1 28,19952 26,14755 30,251502 24,45839 23,01617 25,900623 18,04503 16,86172 19,22834

Nun, da Sie wissen - ganz nach Ihrem Modell - ein Auto mit einem Gewicht von 2,4 Tonnen, im Durchschnitt, ein Kilometer zwischen 23 und 25,9 Meilen pro Gallone. Auf die gleiche Weise können Sie für einen 95 Prozent Prädiktionsintervalls fragen durch das Argument Intervall Einstellung 'Prognose':

vorhersagen> (Modell, newdata = new.cars, Intervall = 'Vorhersage') fit lwr UPR1 28,19952 21,64930 34,749752 24,45839 18,07287 30,843923 18,04503 11,71296 24,37710

Diese Information gibt Aufschluss darüber, dass 95 Prozent der Fahrzeuge mit einem Gewicht von 2,4 Tonnen haben eine Laufleistung irgendwo zwischen 18,1 und 30,8 Meilen pro Gallone - vorausgesetzt, Ihr Modell korrekt ist, natürlich.

Wenn Sie lieber Ihre eigenen Konfidenzintervall bauen möchten, können Sie die Standardfehler auf Ihre Prognosen bekommen auch durch das Argument Einstellung se.fit nach WAHR. Sie brauchen nicht einen Vektor oder eine Matrix- stattdessen erhalten, erhalten Sie eine Liste mit einem Element passen dass enthält die Vorhersagen und ein Element se.fit dass enthält die Standardfehler.

Menü