Wie zu verlängern Text Funktionalität mit Stringr in R
Wenn Sie überhaupt mit den Textbearbeitungsfunktionen von R gearbeitet haben, fragen Sie sich wahrscheinlich, warum all diese Funktionen wie unmemorable Namen haben und scheinbar unterschiedlichen Syntax. Wenn ja, sind Sie nicht allein.
In der Tat, schrieb Hadley Wickham ein Paket von CRAN zur Verfügung, die dieses Paket in R vereinfacht und standardisiert die Arbeit mit Text aufgerufen stringr, und Sie können es mit Hilfe der R-Konsole installieren oder über Werkzeuge-Pakete installieren in RStudio.
Obwohl Sie ein Paket nur einmal zu installieren, müssen Sie es in den Arbeitsbereich laden die Verwendung von Bibliothek() funktioniert jedes Mal, wenn eine neue R-Sitzung starten und planen, die Funktionen in diesem Paket zu verwenden.
install.packages ( "stringr") Bibliothek (stringr)
Hier sind einige der Vorteile der Verwendung von stringr eher als die Standard-R-Funktionen:
Funktionsnamen und Argumente sind konsistent und aussagekräftiger. Zum Beispiel können alle stringr Funktionen beginnend mit Namen str_ (sowie str_detect () und str_replace ()).
stringr hat eine konsistentere Weise mit Fällen mit fehlenden Daten oder leere Werte zu tun haben.
stringr hat eine konsistentere Möglichkeit, sicherzustellen, dass Ein- und Ausgangsdaten des gleichen Typs sind.
Das stringr Äquivalent für grep () ist str_detect (), und das Äquivalent für gsub () ist str_replace_all ().
Als Ausgangspunkt zu erkunden stringr, Sie können einige dieser Funktionen nützlich finden:
str_detect (): Erkennt das Vorhandensein oder Fehlen eines Musters in einem String
str_extract (): Extrahiert das erste Stück einer Zeichenfolge, die einem Muster entspricht
str_length (): Gibt die Länge einer Zeichenfolge (in Zeichen)
str_locate (): Ortet die Position des ersten Auftretens eines Musters in einem String
str_match (): Extrahiert die erste aus einem String abgestimmt Gruppe
str_replace (): Ersetzt das erste Vorkommen eines abgestimmten Muster in einem String
str_split (): Teilt einen String in eine variable Anzahl von Stücken
str_sub (): Extrahiert Strings aus einem Zeichenvektor
str_trim (): Schneidet weißen Raum von Anfang und Ende der Zeichenfolge
str_wrap (): Wraps Strings in schön formatierte Absätze