Text Analytics für unstrukturierte Big Data

Zahlreiche Verfahren existieren für unstrukturierte Daten für Ihre große Daten Initiative zu analysieren. Historisch wurden diese Techniken aus technischen Bereichen wie Natural Language Processing (NLP), Knowledge Discovery, Data Mining, Information Retrieval und Statistiken. Textanalyse ist der Prozess unstrukturiertem Text zu analysieren, relevante Informationen zu extrahieren und sie in strukturierte Informationen umzuwandeln, die dann auf verschiedene Weise genutzt werden können.

Die Analyse- und Extraktionsprozesse Vorteil von Techniken nehmen, die in der Computerlinguistik entstanden, Statistiken und anderen Disziplinen der Informatik.

Manchmal kann ein Beispiel helfen, eine komplexe topic.Suppose zu erklären, die Sie für die Marketing-Abteilung in einem drahtlosen Telefon arbeiten company.You've nur zwei neue Tarifpläne - Plan A und Plan B -und Sie nicht die Aufnahme bekommen Sie wollten über den Plan A.The unstrukturierter Text aus dem Call-Center-Notizen, die Sie vielleicht einen kleinen Einblick geben, warum dies passiert ist.

bild0.jpg

Die unterstrichenen Worte liefern die Informationen, die Sie benötigen, um zu verstehen, warum Plan A ist nicht schnell adoption.For Beispiel gewinnt, hat das Unternehmen Plan A in den Call-Center-Notizen wird angezeigt, was darauf hinweist, dass die Berichte den Plan erwähnen.

Die Begriffe Roll-over-Minuten, 4 GB Daten, Daten-Plan, und teuer Beweise sind, dass ein Problem mit Überroll Minuten, den Datenplan vorhanden ist, und die price.Words wie lächerlich und blöd geben einen Einblick in den Aufrufer Stimmung, die in diesem Fall negativ ist.

Die Textanalyse-Prozess verwendet verschiedene Algorithmen, wie zum Beispiel Verständnis Satzbau, die unstrukturierte Text und thenextract Informationen zu analysieren und diese Information in strukturierte Daten.Verfahren strukturierten Daten aus dem unstrukturierten Text extrahiert Transformation wird in Tabelle 13-1 dargestellt.

KennzeichnungWesenProblemGefühl
Cust XYZPlan AÜberroll MinutenNeutral
Cust ABCPlan AÜberroll MinutenNegativ
XXXXPlan ATeuerNeutral
XXXXPlan ADatentarifNeutral
Cust XYTPlan ADatentarifNegativ

Sie können dies zu betrachten und zu sagen: # 147-Aber ich konnte das herausgefunden haben, indem man die Call-Center-Aufzeichnungen suchen. # 148- Dies sind jedoch nur eine kleine Teilmenge der Informationen von Tausenden von Call Center-Agenten aufgezeichnet werden. Jeder einzelne Agent kann möglicherweise nicht einen breiten Trend in Bezug auf das Problem spüren, mit jedem Plan von der Firma angeboten werden.

Agenten nicht über die Zeit oder Anforderung haben diese Informationen über alle anderen Call Center-Agenten zu teilen, die jedoch ähnliche Zahlen von Anrufen zu Plan A. erhalten werden können, nachdem diese Informationen aggregiert und mithilfe von Textanalyse-Algorithmen verarbeitet, kann ein Trend ergeben sich aus diese unstrukturierten Daten. Das ist, was die Textanalyse so mächtig macht.

Die Suche ist über ein Dokument basierend auf Abruf, welche Endbenutzer bereits wissen, sie suchen. Textanalyse geht es um Informationen zu entdecken. Während die Textanalyse von Suche unterscheidet, kann es Suchtechniken zu erweitern. Zum Beispiel Textanalyse mit Suche verwendet werden, können eine bessere Kategorisierung und Klassifizierung von Dokumenten zur Verfügung zu stellen und Abstracts oder Zusammenfassungen von Dokumenten zu erzeugen.

Es gibt vier Technologien: Abfrage, Data Mining, Such- und Textanalyse. Auf der linken Seite der Tabelle sind Abfrage und Suche, die sowohl wegen des Abrufs sind. Zum Beispiel könnte ein Endbenutzer eine Datenbank abfragen, um herauszufinden, wie viele Kunden gestoppt, um die Dienste im letzten Monat des Unternehmens verwenden.

Die Abfrage würde eine einzelne Zahl zurück. Nur durch mehr und verschiedene Abfragen zu fragen wird der Endbenutzer die Informationen erhalten, erforderlich, um festzustellen, warum Kunden verlassen werden. Ebenso ermöglicht Stichwortsuche den Endbenutzer, die Dokumente zu finden, die die Namen eines Unternehmens Konkurrenten enthalten. Die Suche würde eine Gruppe von Dokumenten zurück. Nur durch Lesen der Dokumente der Endbenutzer mit allen relevanten Antworten kommen würde.

WiederauffindenEinblick
StrukturierteAbfrage: Rückkehr DatenData-Mining: Insight von strukturierten Daten
UnstrukturierteSuche: Gibt Dokumente zurückTextanalyse: Insight aus Text

Die Technologien, auf der linken Rück Stücke von Informationen und erfordern menschliche Interaktion zu synthetisieren und diese Informationen zu analysieren. Die Technologien, auf der rechten Seite - Data Mining und Textanalyse - liefern Einblick viel schneller. Hoffentlich wird der Wert der Textanalyse in Ihrem Unternehmen immer klar.

Menü