Entdecken Sie die Big Data-Stack

Um große Datenmengen zu verstehen, hilft es, zu sehen, wie es stapelt sich - das heißt, um die Komponenten der Architektur legen. Eine große Daten-Management-Architektur muss eine Vielzahl von Dienstleistungen umfassen, die es Unternehmen ermöglichen den Einsatz von unzähligen Datenquellen in eine schnelle und effektive Art und Weise zu machen.

bild0.jpg

Hier ist ein genauerer Blick auf, was im Bild und die Beziehung zwischen den Komponenten:

  • Schnittstellen und Feeds: Auf beiden Seiten des Diagramms sind Hinweise auf Schnittstellen und führt in die und aus den beiden intern verwalteten Daten und Daten-Feeds aus externen Quellen. Um zu verstehen, wie groß Daten funktioniert in der realen Welt, starten Sie durch diese Notwendigkeit zu verstehen.

    Was große Daten groß macht, ist, dass es auf Abholung viele Daten aus vielen Quellen beruht. Deshalb werden offene Application Programming Interfaces (APIs) Kern auf jede beliebige große Datenarchitektur sein.

    Darüber hinaus, denken Sie daran, die Schnittstellen auf jeder Ebene existieren und zwischen jeder Schicht des Stapels. Ohne die Integration Services können große Datenmengen nicht passieren.

  • Redundante physische Infrastruktur: Die Unterstützung der physischen Infrastruktur ist von grundlegender Bedeutung für den Betrieb und die Skalierbarkeit eines großen Datenarchitektur. Ohne die Verfügbarkeit von robusten physischen Infrastrukturen, würde große Daten wahrscheinlich als solche einen wichtigen Trend nicht entstanden.

    Um eine unvorhergesehene oder unvorhersehbare Datenvolumen, eine physische Infrastruktur für große Datenmengen unterstützen muss, anders zu sein als die für herkömmliche Daten. Die physische Infrastruktur ist auf einem verteilten Computing-Modell basiert. Dies bedeutet, dass die Daten physisch in vielen verschiedenen Orten gespeichert werden und können miteinander über Netzwerke verbunden werden, ist die Verwendung eines verteilten Dateisystems und verschiedene große Datenanalysetools und Anwendungen.

  • Sicherheitsinfrastruktur: Je wichtiger große Datenanalyse wird an Unternehmen, desto wichtiger wird es sein, dass die Daten zu sichern. Zum Beispiel, wenn Sie ein Unternehmen im Gesundheitswesen sind, werden Sie wahrscheinlich wollen große Datenanwendungen zu verwenden, um Änderungen in der Demographie oder Verschiebungen in den Bedürfnissen der Patienten zu bestimmen.

    Diese Daten können über Ihre Bestandteile muss sowohl geschützt werden Compliance-Anforderungen gerecht zu werden und die Patienten "Privatsphäre zu schützen. Sie müssen berücksichtigen, die diese Daten sehen darf und unter welchen Umständen sie berechtigt sind, dies zu tun. Sie müssen in der Lage sein, die Identität von Benutzern sowie zum Schutz der Identität von Patienten zu überprüfen.

  • Betriebsdatenquellen: Wenn Sie große Datenmengen denken, zu verstehen, dass Sie alle Datenquellen zu integrieren, dass Sie ein vollständiges Bild Ihres Unternehmens geben und sehen, wie die Daten wirkt sich auf die Art und Weise Sie Ihr Geschäft betreiben.

    Traditionell bestand eine Betriebsdatenquelle von stark strukturierten Daten, die von der Branche in einer relationalen Datenbank verwaltet. Aber wie sich die Welt verändert, ist es wichtig zu verstehen, dass Betriebsdaten nun ein breiteres Spektrum von Datenquellen zu erfassen hat.

Menü