Data Warehouse-Modernisierung mit Hadoop

Data Warehouse sind jetzt unter Stress, versuchen, mit erhöhten Anforderungen an ihre begrenzten Ressourcen zu bewältigen. Hadoop können erhebliche Entlastung in diesem Data Warehouse-Situation.

Der rasche Anstieg in der Menge der in der Welt erzeugten Daten hat auch betroffenen Datenlager, da die Datenmengen sie es schaffen, zu erhöhen sind - zum Teil, weil mehr strukturiert Daten, die Art der Daten, die stark typisierte und geschlitzten in Zeilen und Spalten - erzeugt wird, sondern auch, weil sie oft mit den regulatorischen Anforderungen zu tun haben, entwickelt abfragbaren Zugriff auf historische Daten zu erhalten.

Darüber hinaus wird die Verarbeitungsleistung in Datenlagern häufig verwendeten Transformationen der relationalen Daten durchzuführen, wie es entweder das Lager betritt selbst oder in ein geladenes Kind Data Mart (Eine separate Teilmenge des Data Warehouse) für eine bestimmte Analyseanwendung.

Darüber hinaus wird die Notwendigkeit Erhöhung Analysten neue Abfragen gegen die strukturierten Daten in den Lagern gespeichert zu erteilen, und diese Ad-hoc-Abfragen oft erhebliche Datenverarbeitungsressourcen nutzen können. Manchmal ist ein einmaliger Bericht kann ausreichen, und manchmal eine explorative Analyse ist notwendig, Fragen zu finden, die nicht gefragt worden sind, noch, dass signifikante Geschäftswert ergeben kann.

Unterm Strich ist, dass Datenlager werden häufig für Zwecke außerhalb ihrer ursprünglichen Entwurf verwendet werden.

Die Abbildung zeigt, High-Level-Architektur, wie Hadoop neben Datenlagern leben und einige der Zwecke erfüllen, die sie nicht ausgelegt ist.

bild0.jpg

Hadoop ist ein Lager Helfer, kein Lager Ersatz. Hadoop kann ein Data-Warehousing-Ökosystem in vier modernisieren Möglichkeiten-sie hier zusammenfassend sind:

  • Geben Sie eine Landezone für alle Daten.

  • Persistieren die Daten eine abfragbare Archiv von kalten Daten bereitzustellen.

  • Leverage Hadoop ist groß angelegte Batch-Verarbeitung Effizienz zu Vorprozess und Transformationsdaten für das Lager.

  • Aktivieren Sie eine Umgebung für die Ad-hoc-Datenermittlung.

Menü