Wie die Architectural Foundation für Big Data zu Set

Es ist wichtig, eine starke architektonische Fundament zu legen, wenn Sie mit großen Daten erfolgreich sein wollen. Neben den funktionalen Anforderungen unterstützen, ist es wichtig, die erforderliche Leistung zu unterstützen. Ihre Bedürfnisse hängt von der Art der Analyse, die Sie unterstützen. Sie werden die richtige Menge an Rechenleistung und Geschwindigkeit benötigen.

Ihre Architektur hat auch die richtige Menge an Redundanz zu haben, so dass Sie von unerwarteten Latenz und Ausfallzeiten geschützt sind.

Beginnen Sie, indem Sie sich die folgenden Fragen:

  • Wie viele Daten wird Ihre Organisation benötigen heute und in Zukunft zu verwalten?

  • Wie oft wird Ihre Organisation benötigen, um Daten in Echtzeit oder nahezu in Echtzeit zu verwalten?

  • Wie viel Risiko kann Ihr Unternehmen leisten? Ist Ihre Branche unterliegt strengen Sicherheit, Compliance und Governance-Anforderungen?

  • Wie wichtig ist die Geschwindigkeit, um Ihren Bedarf an Daten verwalten?

  • Wie sicher oder präzise braucht die Daten zu sein?

    bild0.jpg

Schnittstellen und Futtermitteln für große Datenmengen

Um zu verstehen, wie groß Daten funktioniert in der realen Welt ist es wichtig, durch das Verständnis der Notwendigkeit von Schnittstellen und Feeds zu starten. In der Tat, was große Daten groß macht, ist die Tatsache, dass es auf Abholung viele Daten aus vielen Quellen beruht.

Deshalb werden offene Application Programming Interfaces (APIs) Kern auf jede beliebige große Datenarchitektur sein. Darüber hinaus, denken Sie daran, die Schnittstellen auf jeder Ebene existieren und zwischen jeder Schicht des Stapels. Ohne die Integration Services können große Datenmengen nicht passieren.

Redundante große Daten physische Infrastruktur

Die Unterstützung der physischen Infrastruktur ist von grundlegender Bedeutung für den Betrieb und die Skalierbarkeit eines großen Datenarchitektur. In der Tat, ohne die Verfügbarkeit von robusten physischen Infrastrukturen, würde große Daten wahrscheinlich als solche einen wichtigen Trend nicht entstanden. Um eine unvorhergesehene oder unvorhersehbare Datenvolumen, eine physische Infrastruktur für große Datenmengen unterstützen muss, anders zu sein als die für herkömmliche Daten.

Die physische Infrastruktur ist auf einem verteilten Computing-Modell basiert. Dies bedeutet, dass die Daten physisch in vielen verschiedenen Orten gespeichert werden und können miteinander über Netzwerke verbunden werden, ist die Verwendung eines verteilten Dateisystems und verschiedene große Datenanalysetools und Anwendungen.

Redundanz ist wichtig, weil Sie mit so viel Daten aus so vielen verschiedenen Quellen zu tun haben. Redundanz kommt in vielen Formen. Wenn Ihr Unternehmen eine private Cloud erstellt hat, werden Sie Redundanz im privaten Umfeld aufgebaut haben, so dass es skalieren kann wechselnden Workloads zu unterstützen.

Wenn Ihr Unternehmen möchte interne IT-Wachstum enthält, kann es externe Cloud-Services nutzen, um ihre internen Ressourcen zu erweitern. In einigen Fällen kann diese Redundanz kommen in Form von Software as a Service (SaaS) Angebot, das Unternehmen anspruchsvolle Datenanalyse als Dienstleistung zu tun erlaubt. Der SaaS-Ansatz bietet geringere Kosten, schnellere Inbetriebnahme und nahtlose Entwicklung der zugrunde liegenden Technologie.

Big Data Security-Infrastruktur

Je wichtiger große Datenanalyse wird an Unternehmen, desto wichtiger wird es sein, dass die Daten zu sichern. Zum Beispiel, wenn Sie ein Unternehmen im Gesundheitswesen sind, werden Sie wahrscheinlich wollen große Datenanwendungen zu verwenden, um Änderungen in der Demographie oder Verschiebungen in den Bedürfnissen der Patienten zu bestimmen. Diese Daten können über Ihre Bestandteile muss sowohl geschützt werden Compliance-Anforderungen gerecht zu werden und die Patienten "Privatsphäre zu schützen.

Sie müssen berücksichtigen, die diese Daten sehen darf und unter welchen Umständen sie berechtigt sind, dies zu tun. Sie müssen in der Lage sein, die Identität von Benutzern sowie zum Schutz der Identität von Patienten zu überprüfen.

Operative große Datenquellen

Es ist wichtig zu verstehen, dass Sie alle Datenquellen zu integrieren, dass Sie ein vollständiges Bild Ihres Unternehmens geben und sehen, wie die Daten wirkt sich auf die Art und Weise Sie Ihr Geschäft betreiben. Wie sich die Welt verändert, ist es wichtig, dass Betriebsdaten nun ein breiteres Spektrum von Datenquellen, einschließlich unstrukturierter Quellen wie Social-Media-Daten in allen seinen Formen umfassen muss, zu verstehen.

Sie finden neu entstehenden Ansätze zur Datenverwaltung in der großen Datenwelt, einschließlich Dokument, Graph, säulen und Geospatial-Datenbank-Architekturen. Zusammen werden diese bezeichnet als NoSQL, oder nicht nur SQL-Datenbanken. Im Wesentlichen müssen Sie die Daten-Architekturen auf die Arten von Transaktionen abzubilden.

Dies wird dazu beitragen die, um sicherzustellen, Recht Daten zur Verfügung stehen, wenn Sie es brauchen. Sie müssen auch Datenarchitekturen, die komplexe unstrukturierte Inhalte unterstützen. Sie müssen sich nutzbar zu machen große Daten sowohl relationale Datenbanken und nicht relationale Datenbanken in Ihrem Ansatz aufzunehmen. Es ist auch notwendig, unstrukturierten Datenquellen umfassen, wie Content-Management-Systeme, so dass Sie näher an diesem 360-Grad-betriebswirtschaftliche Sicht zu bekommen.

All diese operativen Datenquellen haben mehrere Merkmale gemeinsam:

  • Sie stellen Systeme der Datensatz, der für die Echtzeit erforderlich Spur der kritischen Daten zu halten, von Tag zu Tag Betrieb des Unternehmens.

  • Sie werden laufend auf Basis von Transaktionen aktualisiert geschieht innerhalb von Geschäftseinheiten und aus dem Web.

  • Für diese Quellen eine genaue Darstellung des Unternehmens zur Verfügung zu stellen, müssen sie strukturierte und unstrukturierte Daten mischen.

  • Diese Systeme müssen auch in der Lage sein, zu skalieren Tausende von Benutzern auf eine einheitliche Grundlage zu unterstützen. Dazu gehören beispielsweise Transaktions E-Commerce-Systeme, Customer Relationship Management-Systeme oder Call Center-Anwendungen.

Menü