Replication Services für Data Warehousing

Replication Middleware-Dienste kombinieren Auswahl und Extraktion, Bewegung und Belastung von einer Datenbank in eine oder mehrere andere, in der Regel von einem einzigen DBMS Produkt verwaltet. (Die Quelldatenbank und alle Ziele sind alle Oracle, Sybase alle, oder alle Microsoft SQL Server, zum Beispiel.)

Obwohl die Replikation Service-Funktionen unter DBMS-Produkte variieren, traditionell, sie haben gewesen Snapshot orientiert: Ein Schnappschuss von entweder einer ganzen Datenbank oder die Änderungen seit der letzten Replikation aufgetreten extrahiert werden, zu einer vorbestimmten Zeit von der Quelle und kopiert über einen vernetzten Umgebung an die beabsichtigten Ziele.

Die Daten werden dann übertragen und geladen, wie sie ist (keine Transformation stattfindet). Viele Datenbank-Anbieter haben ihre Replikation implementiert durch die Protokolldateien für Änderungen zu lesen. Diese Art der Replikation ist sehr effizient, weil es nicht den Aufwand des Transaktionssysteme nicht erhöht, die Daten zu replizieren.

Aber Replikation ersetzt nicht die lange Liste von Data-Warehousing-Middleware-Dienste. Sie wollen in erster Linie die Replikation in einem Data-Warehouse-Umgebung zu verwenden, wenn die Erfassung der Änderungen in der Quelldatenbank, die oft als Change Data Capture (CDC), oder nachdem Sie die Daten in Data Warehouse geladen werden und dann Daten zu extrahieren und sie zu Data Marts zu senden, wie in dieser Figur gezeigt.

RDBMS-basierte Replikationsdienste erfassen Änderungen im Quellsystem die Datenauswahl und Extraktionsprozess zu optimieren.

bild0.jpg

Menü