RDBMS-Systeme in einem Big Data Environment

Big Daten wird immer ein wichtiges Element in der Art und Weise Organisationen High-Volume-Daten mit der richtigen Geschwindigkeit sind die Nutzung auf bestimmte Datenprobleme zu lösen. Relational Database Management Systems sind wichtig für diese hohe Lautstärke. Große Daten leben nicht isoliert. Um effektiv zu sein, müssen Unternehmen oft in der Lage sein, die Ergebnisse von großen Datenanalyse mit den Daten zu kombinieren, die innerhalb des Unternehmens vorhanden ist.

Große Datengrundlagen: RDBMS und persistenten Daten

Einer der wichtigsten Dienste von operationalen Datenbanken zur Verfügung gestellt (auch genannt Datenspeicher) Ist Beharrlichkeit. Persistence garantiert, dass die in einer Datenbank gespeicherten Daten werden nicht ohne Berechtigungen geändert werden, und dass sie verfügbar werden, solange es für das Unternehmen von Bedeutung ist. Was nützt eine Datenbank, wenn es nicht um die Daten zu schützen, vertrauen kann man in sie?

In Anbetracht dieser wichtigste Anforderung, dann müssen Sie darüber nachdenken, welche Art von Daten Sie bestehen bleiben, wie können Sie zugreifen und diese aktualisieren, und wie können Sie es verwenden, um Geschäftsentscheidungen zu treffen. An dieser grundlegendsten Ebene, die Wahl Ihrer Datenbank-Engines ist entscheidend für Ihren Gesamterfolg mit Ihrem großen Daten-Implementierung.

Auch wenn die zugrunde liegende Technologie um seit geraumer Zeit gewesen ist, sind viele dieser Systeme heute in Betrieb, weil die Unternehmen, die sie unterstützen, auf die Daten in hohem Maße abhängig sind. So ersetzen würde sie eine Änderung der Motoren eines Flugzeugs auf einem transozeanischen Flug ähnlich sein.

Große Datengrundlagen: RDBMS und Tabellen

Relationale Datenbanken sind gebaut, auf einem oder mehreren Beziehungen und werden durch Tabellen dargestellt. Diese Tabellen werden von ihren Spalten definiert sind, und die Daten werden in den Zeilen gespeichert. Der Primärschlüssel ist oft die erste Spalte in der Tabelle. Die Konsistenz der Datenbank und viel von ihrem Wert durch "Normalisierung" der Daten erreicht. Normierte Daten aus nativen Format in ein gemeinsames umgewandelt wurde, vereinbarten Format.

Zum Beispiel in einer Datenbank können Sie "Telefon" als XXX-XXX-XXXX, während in einem anderen könnte es XXXXXXXXX sein. Um eine konsistente Sicht der Daten zu erreichen, muss das Feld in eine andere Form normiert werden. Fünf Ebenen der Standards existieren für die Normalisierung. Die Wahl der Normalform wird oft mit der Datenbank-Designer verbannt. Die Sammlung von Tabellen, Schlüssel, Elemente und so auf wie die Datenbank bekannt Schema.

Im Laufe der Jahre hat sich die strukturierte Abfragesprache (SQL) im Gleichschritt mit RDBMS Technologie sich weiterentwickelt und ist das am häufigsten verwendete Mechanismus zum Erstellen, abfragt, Wartung und Betriebs relationale Datenbanken.

In Unternehmen, kleine und große, die meisten ihrer wichtigen operativen Informationen werden wahrscheinlich im RDBMS gespeichert. Viele Unternehmen haben unterschiedliche RDBMS für verschiedene Bereiche ihres Geschäfts. Transactional Daten können in einem Lieferanten-Datenbank gespeichert werden, während Kundeninformationen könnten in einem anderen gespeichert werden.

Es ist nicht wahrscheinlich, dass Sie RDBMS für den Kern der Implementierung verwenden, aber Sie werden auf die gespeicherten Daten in RDBMS verlassen müssen, um die höchste Wert für das Unternehmen mit großen Daten zu erstellen.

PostgreSQL, ein Open-Source-relationalen Datenbank

Während der großen Datenimplementierung, werden Sie wahrscheinlich über gekommen PostgreSQL, eine weit verbreitete Open-Source-relationalen Datenbank. Verschiedene Faktoren tragen zu der Popularität von PostgreSQL beitragen. Als RDBMS mit Unterstützung für die SQL-Standard, hat es alle Dinge in einer Datenbank Produkt erwartet, plus seine Langlebigkeit und breite Verwendung haben es "Kampf getestet." Es ist auch auf fast jeder Vielzahl von Betriebssystem, vom PC bis zum Mainframe.

die Grundlagen Bereitstellung und so zuverlässig tun sind nur ein Teil der Geschichte. PostgreSQL unterstützt auch viele Funktionen, die nur in teuren proprietären RDBMS gefunden, darunter die folgenden:

  • Capability direkt zu handhaben "Objekte" im relationalen Schema

  • Fremdschlüssel (Referenzierung Schlüssel aus einer Tabelle in einem anderen)

  • Trigger (Ereignisse verwendet, um automatisch eine gespeicherte Prozedur starten)

  • Komplexe Abfragen (Unterabfragen und schließt sich über diskrete Tabellen)

  • Transactional Integrität

  • Multiversion Concurrency Control

Die wahre Stärke von PostgreSQL ist seine Erweiterbarkeit. Benutzer und Datenbank-Programmierer können neue Funktionen hinzufügen, ohne den grundlegenden Betrieb oder Zuverlässigkeit der Datenbank zu beeinflussen. Mögliche Erweiterungen umfassen

  • Datentypen

  • Die Betreiber

  • Funktionen

  • Indexierungsmethoden

  • Verfahrenssprachen

Dieses hohe Maß an Anpassung macht PostgreSQL wünschenswert, wenn starre, proprietäre Produkte werden den Job zu erledigen nicht bekommen. Es ist unendlich erweiterbar.

Schließlich erlaubt die PostgreSQL Lizenz Modifikation und Verbreitung in jeglicher Form, offene oder geschlossene Quelle. Alle Änderungen können mit der Gemeinde gehalten privat oder gemeinsam genutzt werden, wie Sie es wünschen.

Menü