Text Analytics-Tools für Big Data

Hier ist eine Übersicht über einige der Spieler in der Textanalyse großer Datenmarkt. Einige sind klein, während andere bekannte Namen sind. Manche nennen, was sie tun Big Data Textanalyse

, während einige nur darauf verweisen, wie Textanalyse.

Attensity für große Datenmengen

Attensity ist einer der Textanalyse-Unternehmen Original, das vor begann mit der Entwicklung und Produkte mehr als zehn Jahren zu verkaufen. Zu diesem Zeitpunkt hat es mehr als 150 Unternehmenskunden und einer der größten NLP Entwicklungsgruppen der Welt. Attensity bietet mehrere Motoren für Textanalyse. Dazu gehören Auto-Klassifizierung, Entity-Extraktion und erschöpfende Extraktion. Erschöpfende Extraktion ist Flaggschiff-Technologie von Attensity, die automatisch extrahiert Fakten aus analysiert Text und organisiert diese Informationen.

Das Unternehmen konzentriert sich auf soziale und mehrkanaligen Analytik und Engagement von Text Analyse für aus internen und externen Quellen Reporting und Routing sie dann an Business-Anwender für den Eingriff. Es vor kurzem gekauft Biz360, eine Social-Media-Unternehmen, die große Ströme von Social-Media-Aggregate. Es hat sich ein Grid-Computing-System entwickelt, das High-Performance-Fähigkeiten für die Verarbeitung großer Mengen von Echtzeit-Text zur Verfügung stellt.

Attensity verwendet einen Hadoop Rahmendaten zu speichern. Es hat auch eine Datenwarteschlangensystem, das eine Orchestrierung Prozess erzeugt, die Spitzen in der eingehenden Daten erkennt und stellt Verarbeitung über mehr / weniger Servern nach Bedarf.

Clarabridge für große Datenmengen

Ein weiterer Pure-Play-Textanalyse-Anbieter, Clarabridge ist eigentlich ein Beratungsunternehmen eines Business-Intelligence (BI) (genannt Claraview), die die Notwendigkeit erkannt, um mit unstrukturierten Daten Spin-off. Sein Ziel ist es, indem man die Kundenschlüssel Erfahrungen und Probleme ganzheitlich, Ortung Unternehmen treiben messbaren Mehrwert zu helfen, und helfen, alle in einer Organisation Maßnahmen ergreifen und die Zusammenarbeit in Echtzeit.

Dazu gehören Echtzeit-Bestimmung des Gefühls und der Klassifizierung von Kunden-Feedback-Daten / Text und das wörtlich für die zukünftige Verarbeitung in das System Clarabridge Inszenierung.

Zu diesem Zeitpunkt wird Clarabridge seine Kunden einige anspruchsvolle und interessante Features bieten, darunter Ein-Klick-Ursachenanalyse zu ermitteln, was im Textvolumen eine Änderung verursacht Feeds, die Stimmung oder die Zufriedenheit mit der neuen Probleme verbunden. Es bietet auch die Lösung als Software as a Service (SaaS).

IBM für große Datenmengen

Software-Riese IBM bietet verschiedene Lösungen in der Textanalyse-Raum im Rahmen ihrer Strategie Regenschirm Smarter Planet. Abgesehen von Watson und IBM SPSS, IBM bietet auch IBM Content Analytics mit Enterprise Search. IBM Content Analytics basiert auf Arbeit bei IBM Research entwickelt.

IBM Content Analytics wird verwendet, um Inhalte in analysierten Informationen zu verwandeln, und dies ist für detaillierte auf die Art und Weise strukturierte Daten ähnliche Analysen würden in einem BI-Toolset analysiert werden. IBM Content Analytics und Enterprise Search waren einmal zwei separate Produkte.

Die konvergente Lösung zielt sowohl auf verbesserte Unternehmenssuche, die Textanalyse verwendet, sowie Stand-alone-Content Analytics Bedürfnisse. ICAES hat eine enge Integration mit dem IBM InfoSphere BigInsights Plattform, die sehr große Such- und Content-Analyse-Sammlungen.

Open Text für große Datenmengen

Open Text, a-kanadisches Unternehmen, ist wahrscheinlich für seine Führung im Bereich Enterprise Information Management-Lösungen bekannt. Seine Vision dreht sich um die Verwaltung, Sicherung und Extrahieren Wert aus den unstrukturierten Daten von Unternehmen. Es bietet, was es Begriffe # 147-semantische Middleware # 148.

Nach Angaben des Unternehmens ist seine semantische Technologie Evolution in seiner Fähigkeit, verwurzelt # 147 zu ermöglichen Echtzeit-Analysen mit hoher Genauigkeit auf große Datenmengen über Sprachen, Formate und Industrie-Domänen. # 148- Die Idee hinter semantische Middleware ist, dass Semantik kann mit unterschiedlichen Technologien auf verschiedenen Ebenen und arbeiten ausgesetzt sein Unternehmen zu adressieren Probleme.

Mit anderen Worten können die Textanalyse aktiviert und genutzt werden, wo nötig.

SAS für große Datenmengen

SAS wurde für eine lange Zeit die Lösung komplexer große Datenprobleme. Vor einigen Jahren gekauft, es Textanalyse-Anbieter Teragram seine Strategie zur Verbesserung sowohl strukturierte als auch unstrukturierte Daten in der Analyse zu verwenden und diese Daten für deskriptive und prädiktive Modellierung zu integrieren. Nun, seine Textanalysefunktionen sind Teil ihrer gesamten Analyseplattform und Textdaten werden als einfach eine andere Datenquelle betrachtet.

SAS weiterhin im Bereich der High-Performance-Analyse zur Innovation, um sicherzustellen, dass die Leistung die Erwartungen der Kunden erfüllt. Das Ziel ist es, Probleme zu nehmen, die früher Wochen nehmen sie in Tagen zu lösen und zu lösen, oder Probleme, die früher Tage dauerte, sie in Minuten anstatt zu lösen und zu lösen.

Zum Beispiel ist die SAS High Performance Analytics Server ein In-Memory-Lösung, die Sie Analysemodelle mit kompletten Daten entwickeln können, nicht nur eine Teilmenge der aggregierten Daten. SAS sagt, dass Sie Tausende von Variablen und Millionen von Dokumenten im Rahmen dieser Analyse verwenden können. Die Lösung läuft auf EMC Greenplum oder Teradata Appliances sowie auf handelsüblicher Hardware mit Hadoop Distributed File System (HDFS).

Menü