Wie Frequenzen oder Wichten mit Ihren Daten in R zu verwenden

Durch das Brechen Ihre Daten in Intervallen in R nach oben, verlieren Sie noch einige Informationen. Dennoch ist die umfassendste Möglichkeit, Ihre Daten zu beschreiben, durch die Abschätzung Wahrscheinlichkeitsdichtefunktion

Menu

(PDF) oder Dichte Ihrer Variablen.

Wenn dieses Konzept zu Ihnen nicht vertraut ist, keine Sorge. Denken Sie daran, dass die Dichte auf die Chance, proportional ist, dass jeder Wert in Ihrer Daten etwa gleich auf diesen Wert. In der Tat, für ein Histogramm wird die Dichte von den Zählungen berechnet, so ist der einzige Unterschied zwischen einem Histogramm mit Frequenzen und eine mit Dichten ist das Ausmaß der y-Achse. Für den Rest, sie sehen genau das gleiche.

Wie eine Dichte Grundstück zu erstellen

Sie können die Dichtefunktion einer Variablen schätzen die Verwendung von Dichte() Funktion. Die Ausgabe dieser Funktion hat sich nicht so viel sagen, aber man kann es leicht in einem Grundstück verwendet werden. Zum Beispiel können Sie die Dichte der Meilenzahlvariable erhalten mpg so was:

> mpgdens lt; - Dichte (Autos $ mpg)

Das Objekt, das Sie auf diese Weise erhalten Sie eine Liste eine Vielzahl von Informationen enthält, die Sie nicht wirklich brauchen, zu betrachten. Aber diese Liste macht Auftragen der Dichte so einfach wie sagen # 147-Plot die Dichte # 148-:

> Grundstück (mpgdens)

Das Grundstück sieht ein wenig an den Rändern rau, aber das Wichtigste ist, zu sehen, wie Ihre Daten herauskommt. Die Dichte Objekt wird als Linie dargestellt, mit den tatsächlichen Werten Ihrer Daten auf der x-Achse und die Dichte auf die y-Achse.

image0.png

Das mpgdens Liste Objekt enthält - unter anderem - ein Element namens x und ein genannt y. Diese stellen die x- und y-Koordinaten für die Dichte der Kalibratoren. Wenn R berechnet die Dichte, die Dichte() Funktion teilt die Daten in einer Reihe von kleinen Intervallen und berechnet die Dichte für den Mittelpunkt eines jeden Intervalls. Diese Mittelpunkte sind die Werte für x, und die berechneten Dichten sind die Werte für y.

Wie Dichten in einem Histogramm darstellen

Denken Sie daran, dass die hist () Funktion gibt die Zählungen für jedes Intervall. Nun ist die Chance, dass ein Wert innerhalb eines bestimmten Intervalls liegt, ist direkt proportional zu den Zählungen. Je mehr Werte haben Sie innerhalb eines bestimmten Intervalls, desto größer die Chance, dass jeder Wert, den Sie nahm in diesem Intervall liegt.

Anstatt also die Zählungen in dem Histogramm Plotten, könnten Sie genauso gut die Dichten zeichnen. R macht alle Berechnungen für Sie - das einzige, was Sie tun müssen, die festgelegt ist Freq Argument hist () nach FALSCH, so was:

> Hist (Cars $ mpg, col = 'grau', Freq = FALSE)

Nun wird das Grundstück genau gleich aussehen wie vor-die Werte nur auf die y-Achse sind unterschiedlich. Die Skala auf der y-Achse wird so eingestellt, dass Sie die Dichteverteilung über das Histogramm hinzufügen können. Dazu verwenden Sie die Linien () Funktion mit der Dichte-Objekt als Argument.

So können Sie zum Beispiel Lust auf das vorherige Histogramm ein bisschen weiter nach oben, indem die geschätzte Dichte, den folgenden Code unmittelbar nach dem vorherigen Befehl:

> Leitungen (mpgdens)

Sie sehen das Ergebnis dieser beiden Befehle auf der rechten Seite. Erinnere dich daran Linien () verwendet das x und y Elemente aus der Dichte Objekt mpgdens die Linie zu zeichnen.

Menü