Middleware-Dienste: Datenzuordnung und Transformation

Diese Figur zeigt eine Umgebung, in der Daten von drei verschiedenen Datenquellen für die Aufnahme in einem Data-Warehouse extrahiert wird, und jeder der drei Quellen ist auf einer anderen Plattform. An einem gewissen Punkt in der Middleware-Prozess, diese QA'd Extrakte müssen gemeinsam für eine kombinierte Mapping und Transformationsprozess gebracht werden.

bild0.jpg

Das Mapping und Transformation Service Griffe der klassischen Data-Warehousing-Probleme. Nehmen wir an, eine Datenquelle Kunden durch die Verwendung eines fünfstellige Kundennummer speichert, und eine andere Quelle verwendet einen sechsstelligen numerischen Kundenkennung.

Um Vergleiche und andere Data Warehouse-Verarbeitung zu aktivieren, müssen Sie eine gängige Methode der Identifizierung der Kunden: Eine der Identifikationssysteme müssen auf die andere umgewandelt werden, oder vielleicht eine dritte, neutrale Identifikationssystem, abhängig von den Eigenschaften der Umgebung.

Darüber hinaus systemübergreifende Inkompatibilitäten Handhabung können zusätzliche Transformationen umfassen

  • Datenübersicht: Eine Zusammenfassung kann in dem Verfahren durchgeführt, früher, vor der systemübergreifende Bewegung, je nach den Besonderheiten Ihrer spezifischen Data-Warehousing-Umgebung.

  • Selektive Aufnahme von Daten: Sie könnten Datensätze aus nur einer Datenquelle, beispielsweise ein, wenn Sie einen vergleichbaren Datensatz aus einem anderen Extrakt erhalten. Sie wissen nicht, bis Sie alle Datenquelle die Beiträge zusammenlaufen, wie selektive Einbeziehung Regeln angewendet werden.

  • Daten-Konvergenz: Bestimmte Elemente aus einer Datenquelle mit Elementen aus einer anderen Quelle kombiniert für jeden Kunden, Produkt, Vertrag eine einheitliche Datensatz zu erstellen, oder was auch immer Art von Daten mit Ihnen zu tun haben.

Der wichtigste Punkt über die Kartierung und Transformation Service zu erinnern ist, dass Sie an den Abschluss haben, sollte ein einheitlicher Satz von Daten, die bereit ist, in das Data Warehouse zu laden - sobald Sie ein paar Schritte aus.

In komplexen Data-Warehousing-Umgebungen, können Sie mehrere Transformationsprozesse zu berücksichtigen. Wie in dieser Figur gezeigt, beispielsweise konvergieren Datenextrakte auf verschiedenen Ebenen der Transformation, bevor weiter unten auf der Middleware-Pipeline bewegt, so dass sie durch die Verwendung mehrerer Server früh in Strömungs mehr PS auf den Umwandlungsprozess anwenden.

image1.jpg

Menü