Replikations-Middleware-Dienste kombinieren Auswahl und Extrahierung, Verschiebung und Laden von einer Datenbank zu einer oder mehreren anderen, die normalerweise von einem einzelnen DBMS-Produkt verwaltet werden. (Die Quellendatenbank und alle Ziele sind alle Oracle, alle Sybase oder alle Microsoft SQL Server zum Beispiel.)
Obwohl die Replikationsdienstleistungsfähigkeiten bei DBMS-Produkten unterschiedlich sind, waren sie traditionell Snapshot-orientiert: Ein Schnappschuss von entweder eine gesamte Datenbank oder die Änderungen seit der letzten durchgeführten Replikation werden zu einem vorbestimmten Zeitpunkt aus der Quelle extrahiert und über eine Netzwerkumgebung zu den beabsichtigten Zielen kopiert.
Die Daten werden dann unverändert übertragen und geladen (keine Umwandlung erfolgt). Viele Datenbankanbieter haben ihre Replikation implementiert, indem sie die Protokolldateien nach Änderungen durchgelesen haben. Diese Art der Replikation ist sehr effizient, da sie den Aufwand Ihrer Transaktionssysteme zur Replikation der Daten nicht erhöht.
Die Replikation ersetzt jedoch nicht die lange Liste der Data Warehousing-Middleware-Services. Sie möchten die Replikation in einer Data Warehousing-Umgebung hauptsächlich beim Erfassen von Änderungen in der Quellendatenbank verwenden, die häufig als Änderungsdatenerfassung (CDC) bezeichnet wird oder nachdem Sie die Daten in Ihr Data Warehouse geladen und dann Daten extrahiert und gesendet haben. es zu Data Marts, wie in dieser Abbildung gezeigt.
RDBMS-basierte Replikationsdienste erfassen Änderungen im Quellsystem, um den Datenauswahl- und -extraktionsprozess zu optimieren.