Wie für mehrere Wörter in R zu suchen

Wenn Sie mit Text in R arbeiten, müssen Sie Wörter oder Muster innerhalb Text zu finden. Stellen Sie sich vor Sie haben eine Liste der Staaten in den Vereinigten Staaten, und Sie möchten, um herauszufinden, welcher Staat Namen von zwei Wörtern bestehen.

Für Strings, können Sie mit dem grep () Funktion, die zwei wesentliche Argumente übernimmt:

  • Muster: Das Muster wollen Sie zu finden.

  • x: Der Charakter Vektor Sie suchen möchten.

Also, wie finden Sie die Namen aller Staaten mit mehr als einem Wort? Dies ist einfach, wenn Sie feststellen, dass Sie die Frage Rahmen kann alle diese Staaten durch zu finden, die einen Raum enthalten:

> State.name [grep ( "", state.name)] [1] "New Hampshire" "New Jersey" [3] "New Mexico" "New York" [5] "North Carolina" "North Dakota" [7 ] "Rhode Island" "South Carolina" [9] "South Dakota" "West Virginia"

Die Ergebnisse umfassen alle Staaten, die Zwei-Wort-Namen, wie New Jersey, New York, North Carolina, South Dakota, und West Virginia haben.

Sie können aus dieser Liste sehen, dass es keine staatlichen Namen, die enthalten Osten. Sie können dies bestätigen, indem Sie eine andere Entdeckung machen:

> State.name [grep ( "Ost", state.name)] Zeichen (0)

Wenn das Ergebnis einer Zeichenoperation ist ein leerer Vektor (das heißt, es gibt nichts in ihm) steht R als Zeichen (0). In ähnlicher Weise eine leere oder Null-Länge wird numerisch Vektor dargestellt mit Ganzzahl (0) oder numerisch (0).

R macht einen Unterschied zwischen NULL und ein leerer Vektor. NULL bedeutet in der Regel etwas ist nicht definiert. Dies ist auf subtile Weise unterscheidet sich von etwas, das leer ist. Beispielsweise ein Zeichenvektor, der keine Elemente zu haben, geschieht, ist immer noch ein Zeichenvektor, dargestellt durch Zeichen (0).

Menü