Wie zu verlängern Text Funktionalität mit Stringr in R

Wenn Sie überhaupt mit den Textbearbeitungsfunktionen von R gearbeitet haben, fragen Sie sich wahrscheinlich, warum all diese Funktionen wie unmemorable Namen haben und scheinbar unterschiedlichen Syntax. Wenn ja, sind Sie nicht allein.

In der Tat, schrieb Hadley Wickham ein Paket von CRAN zur Verfügung, die dieses Paket in R vereinfacht und standardisiert die Arbeit mit Text aufgerufen stringr, und Sie können es mit Hilfe der R-Konsole installieren oder über Werkzeuge-Pakete installieren in RStudio.

Obwohl Sie ein Paket nur einmal zu installieren, müssen Sie es in den Arbeitsbereich laden die Verwendung von Bibliothek() funktioniert jedes Mal, wenn eine neue R-Sitzung starten und planen, die Funktionen in diesem Paket zu verwenden.

install.packages ( "stringr") Bibliothek (stringr)

Hier sind einige der Vorteile der Verwendung von stringr eher als die Standard-R-Funktionen:

  • Funktionsnamen und Argumente sind konsistent und aussagekräftiger. Zum Beispiel können alle stringr Funktionen beginnend mit Namen str_ (sowie str_detect () und str_replace ()).

  • stringr hat eine konsistentere Weise mit Fällen mit fehlenden Daten oder leere Werte zu tun haben.

  • stringr hat eine konsistentere Möglichkeit, sicherzustellen, dass Ein- und Ausgangsdaten des gleichen Typs sind.

Das stringr Äquivalent für grep () ist str_detect (), und das Äquivalent für gsub () ist str_replace_all ().

Als Ausgangspunkt zu erkunden stringr, Sie können einige dieser Funktionen nützlich finden:

  • str_detect (): Erkennt das Vorhandensein oder Fehlen eines Musters in einem String

  • str_extract (): Extrahiert das erste Stück einer Zeichenfolge, die einem Muster entspricht

  • str_length (): Gibt die Länge einer Zeichenfolge (in Zeichen)

  • str_locate (): Ortet die Position des ersten Auftretens eines Musters in einem String

  • str_match (): Extrahiert die erste aus einem String abgestimmt Gruppe

  • str_replace (): Ersetzt das erste Vorkommen eines abgestimmten Muster in einem String

  • str_split (): Teilt einen String in eine variable Anzahl von Stücken

  • str_sub (): Extrahiert Strings aus einem Zeichenvektor

  • str_trim (): Schneidet weißen Raum von Anfang und Ende der Zeichenfolge

  • str_wrap (): Wraps Strings in schön formatierte Absätze

Menü