Wie nach Split Strings in R

Eine Sammlung von kombinierten Buchstaben und Wörtern wird als ein String. Jedes Mal, wenn Sie mit Text arbeiten, müssen Sie in der Lage zu sein, Worte zu verketten (string sie zusammen) und teilen sie auseinander. In R, verwenden Sie die Paste() Funktion zu verketten und die strsplit () funktionieren aufzuspalten. In diesem Abschnitt zeigen wir Ihnen, wie Sie beide Funktionen zu nutzen.

Erstellen Sie zunächst ein Zeichen Vektor genannt pangram, und weisen Sie ihm den Wert "Der schnelle braune Fuchs springt über den faulen Hund", wie folgt:

> pangram lt; - "Der schnelle braune Fuchs springt über den faulen Hund"> ​​pangram [1] "Der schnelle braune Fuchs springt über den faulen Hund"

So teilen Sie diesen Text in der Wortgrenzen (Leerzeichen), können Sie strsplit () wie folgt:

> Strsplit (pangram, "") [[1]] [1] "Die" "Quick" "braun" "Fuchs" "springt" "über" "die" "faul" "dog"

Beachten Sie, dass die ungewöhnliche erste Zeile strsplit ()'S Ausgabe besteht aus [[1]]. Ähnlich wie die R-Vektoren zeigt, [[1]] bedeutet, dass R das erste Element einer Liste angezeigt wird. Listen sind äußerst wichtige Konzepte in R- sie ermöglichen es Ihnen, alle Arten von Variablen zu kombinieren.

In dem vorhergehenden Beispiel hat diese Liste nur ein einziges Element. Ja, das ist richtig: Die Liste ein Element hat, aber das Element ist ein Vektor.

Um ein Element aus einer Liste zu extrahieren, müssen Sie doppelte eckige Klammern verwenden. Teilen Sie Ihre pangram in Worte, und das erste Element einer neuen Variablen zugewiesen werden genannt Wörter, mit doppelseitigem Eckige-Klammer ([[]]) Subsetting, wie folgt:

Wörter lt; - strsplit (pangram, "") [[1]]> Worte [1] "Die" "Quick" "braun" "Fuchs" "springt" "über" "die" "faul" "dog"

Um die einzigartigen Elemente eines Vektors, darunter ein Vektor von Text, verwenden Sie die einzigartig() Funktion. In der variablen Wörter, "das" zweimal angezeigt: einmal in Klein und einmal mit den ersten Buchstaben groß geschrieben. Um eine Liste der einzigartigen Wörter bekommen, zuerst konvertieren Wörter in Kleinbuchstaben und verwenden Sie dann einzigartig:

> Unique (tolower (Worte)) [1] ", die" "Quick" "braun" "Fuchs" "Sprünge" "über" "lazy" [8] "dog"

Menü