Visualizing NoSQL

Speicherung großer Datenmengen abgerufen werden und so schnell tun, ist groß, und wenn Sie Ihre neu verwalteten Daten in NoSQL haben, können Sie große Dinge tun.

Menu

Entity-Extraktion und Anreicherung

Sie können Datenbank-Trigger, Warnungsmaßnahmen verwenden und externen Systemen Quelldaten zu analysieren. Vielleicht ist es meist frei Text erwähnt aber bekannte Themen. Diese Trigger und Warnaktionen könnten den Text markieren als eine Person oder Organisation zu sein, effektiv Tagging den Inhalt selbst, und das Dokument wird es legt innerhalb.

Ein gutes Beispiel ist der Inhalt in einem Zeitungsartikel. Sie können ein Tool wie Apache Stanbol oder OpenCalais verwenden, um Schlüsselbegriffe zu identifizieren. Diese Werkzeuge können sehen # 147-Präsident Putin # 148- und entscheiden, diese auf eine Person bezieht sich Vladimir Putin genannt, die Russisch ist, und ist der derzeitige Präsident der Russischen Föderation.

Weitere Beispiele sind Krankheit und Medikamente Namen, Organisationen, Gesprächsthemen, Produkte erwähnt, und ob ein Kommentar positiv oder negativ war.

Dies sind alles Beispiele von Entity-Extraktion (Das ist der Vorgang der automatischen Typen von Objekten von ihren Textnamen Extrahieren). Durch die Identifizierung von Schlüsselbegriffen, können Sie sie markieren, oder sie in einem XML-Element setzen, das Sie Inhalte effektiver zu suchen hilft.

Entity Bereicherung bedeutet, Informationen hinzuzufügen basierend auf dem ursprünglichen Text neben ihm zu identifizieren. Im Putin Beispiel können Sie die Klartextwort drehen # 147-Putin # 148- in Präsident Putin. Alternativ können Sie drehen # 147-London # 148- in London.

Sie können in einer Benutzeroberfläche als markierten Text mit einem Link zu weiteren Informationen zu jedem Thema, diese Daten zeigen.

Sie können Bereicherung bieten durch free # 8208 Textsuche, Alarmierung, Datenbank-Trigger und Integrationen externer Software wie TEMIS Luxid und Smartlogic verwenden.

Suchen und Alarmierung

Sobald Sie Ihre Informationen speichern, können Sie es zu suchen. Free # 8208 Textsuche ist einfach, aber nach dem Entity-Extraktion durchgeführt wird, haben Sie mehr Möglichkeiten. Sie können gezielt nach einer Person suchen benannt # 147-orange # 148- (wie in Wilhelm von Oranien), anstatt zu durchsuchen, die den Begriff Orange erwähnen - was natürlich ist auch eine Farbe und eine Frucht.

Dadurch ergibt sich so in einer detaillierteren Suche. Es ermöglicht auch facettierte Navigation. Wenn Sie zu Amazon gehen und für Harry Potter zu suchen, werden Sie Kategorien für Bücher, Filme, Spiele, und so weiter sehen. Das Produktkategorie ist ein Beispiel für eine Facette, das zeigt Ihnen einen Aspekt von Daten in den Suchergebnissen - das heißt, die am häufigsten verwendeten Werte jeder Facette über alle Suchergebnisse, auch diejenigen, die nicht auf der aktuellen Seite.

Benutzer-Schnittstellen können reich Erkundungen in Daten (sowie grundlegende Google # 8208-esque Suchen) unterstützen. Benutzer können sie auch vorherigen Suchen speichern und laden nutzen zu.

Sie können bis gespeicherten Suchkriterien so eingestellt, dass Benachrichtigungen aktiviert werden, wenn neu hinzugefügten Datensätze, die Kriterien entsprechen. Also, wenn ein neuer Rekord erreicht, dass entspricht Ihren Suchkriterien kommt es zu einer Aktion. Vielleicht # 147-Putin # 148- wird # 8197-Putin, oder vielleicht eine E-Mail können Sie wissen, eine neue wissenschaftliche Artikel veröffentlicht.

Nicht alle Suchmaschinen sind in der Lage, jeden Suchbegriff eine Warnung zu machen. Einige beschränken sich andere Felder-in Text kann nicht geospatial Kriterien tun. Achten Sie darauf, Ihnen die Warnungen umgehen können Sie konfigurieren.

Aggregatfunktionen

Sobald Sie relevanten Informationen finden, können Sie tiefer zu graben. Je nach Quelle, könnte man fragen, wie viele Länder haben ein BIP von mehr als 400.000.000.000 $, oder was ist das Durchschnittsalter aller Mitglieder in Ihrem Stammbaum, oder wo tun die meisten Schlangenbisse kommen in Australien. Diese Beispiele zeigen, wie Analytik über einen Satz von Suchergebnissen durchgeführt werden. Diese werden zählen, bedeuten Durchschnitt und Geospatial Heatmap Berechnungen sind.

Die Möglichkeit, solche Berechnungen neben den Daten eine Reihe von Vorteilen bietet. Der erste Vorteil ist, dass Sie die Indizes die Dinge zu beschleunigen verwenden können. Zweitens sind diese Indizes wahrscheinlich im Arbeitsspeicher zwischengespeichert werden, um sie noch schneller zu machen. Drittens sind in Speicher Indizes besonders nützlich für eine NoSQL Datenbank Hadoop File System (HDFS) Speicher mit. HDFS macht keine nativen Indizierung oder in # 8208-Speicherspalte speichert für eine schnelle Aggregation Berechnungen selbst - es erfordert eine NoSQL-Datenbank auf, dies zu tun.

Facettierte Navigation ist ein Beispiel für Zahl # 8208 basierte Aggregationen über Suchergebnisse, die in einer Benutzeroberfläche angezeigt. Das gleiche gilt für eine Zeitleiste true, um die Anzahl der Datensätze zeigt, die einen bestimmten Zeitpunkt nennen. Zum Beispiel wollen Sie Ergebnisse aus diesem Jahr, in diesem Monat, oder diese Stunde zu zeigen?

Wenn Sie diese Funktion wünschen, sollten Sie Ihre Datenbank die Möglichkeit, Aggregate effizient neben den Daten zu berechnen hat. Die meisten NoSQL-Datenbanken zu tun, aber einige nicht.

Charting und Business Intelligence

Die nächste offensichtliche Benutzer # 8208-Schnittstelle Erweiterung umfasst Charting und Anzeigen von Tabellenübersicht für die Live-Management-Informationen und historische Business-Intelligence-Analyse.

Die meisten NoSQL-Datenbanken bieten eine einfache # 8208 zu # 8208-Integration REST-API in ihre # 173-Datenbanken. Dies bedeutet, dass Sie in einer Reihe von Anwendungsebenen anschließen können, oder sogar direkt javascript-Anwendungen zu diesen Datenbanken verbinden. Eine Vielzahl von exzellenten Charting-Bibliotheken sind für javascript verfügbar. Sie können sogar das R-Ökosystem verwenden, um Diagramme in diesen Datenbanken gespeichert basierend auf Daten zu erstellen, nachdem eine entsprechende Datenbank-Connector zu installieren.

Einige NoSQL-Datenbanken bieten auch eine ODBC oder JDBC-relationalen Datenbank-Plug # 8208-in. Das Erstellen von Indizes innerhalb eines gegebenen Datensatz und sie als eine zeigt # 173-relationale Sicht ist eine nette Art und Weise unstrukturierte Daten in einer NoSQL Dokumentendatenbank in Daten zu verwandeln, die mit einem Business-Intelligence-Tool analysiert werden kann.

Überprüfen Sie, ob Ihre NoSQL Datenbank-Anbieter bietet Visualisierungstools oder hat mit Werkzeugen Geschäftspartnern als zu diesen Datenbanken verbinden können. In vogue Tools umfassen Tableau Server, die eine moderne Gemeinschaftsgeschäft # 173-Intelligence-Server, interaktive Berichte über Daten in einer Vielzahl von Datenbanken unterstützt die Veröffentlichung, einschließlich NoSQL-Datenbanken.

Menü