Video: Enterprise Information System using SSIS 2025
Um 1995 begannen die Anbieter, ihre Software als virtuelle Data-Warehousing-Tools zu positionieren. Die grundlegende Prämisse war, dass es manchmal einfach keinen Sinn macht, eine Menge Daten zu kopieren und zu manipulieren, nur für den Fall, dass jemand es braucht. Warum nicht direkt nach Bedarf auf die Daten zugreifen?
Leider hat sich der Zugriff auf Daten über ein Netzwerk an der Quelle als die am wenigsten herausfordernde der Probleme bei dem Versuch herausgestellt, eine Art von direktem Data Warehousing bereitzustellen. Die gleichen Herausforderungen in jeder Data-Warehousing-Umgebung (z. B. Umgang mit Datenqualität, Entscheidung darüber, welche Arten von Transformationen auftreten müssen, und Auswahl, wie diese Transformationen zu handhaben sind, wenn unterschiedliche Quellen inkonsistent sind) sind immer noch vorhanden.
Nur weil Sie an der Quelle zu Daten gelangen können (in fast jeder Datenbank oder Dateistruktur), bedeutet das nicht, dass Daten die nötigen Business Intelligence liefern, wenn sie in Ihren Händen sind.
Um diese Datenqualitätsprobleme zu lösen, haben viele Datenarchitekten damit begonnen, eine Bottom-up-Data-Mart-Konstruktion durchzuführen, um ein komponentenbasiertes Data-Warehouse zu entwickeln. Anstelle einer einzigen Datenbank, in die Sie alle Daten einspeisen (Erstellen Ihres Data Warehouse), verarbeitet eine Reihe von Komponenten jeweils eine bestimmte Gruppe von Funktionen (z. B. die Beantwortung bestimmter Geschäftsfragen) oder bestimmte Themen. Zusammen umfassen diese Datamarts (oder Komponenten) eine Data Warehousing-Umgebung.
Diese komponentenbasierte, dynamische Zugangsdatenarchitektur ist die Grundlage für das virtuelle Data Warehousing und insbesondere für die Bereitstellung von Enterprise Information Integration (EII) -Servern auf dem Markt.
Diese Abbildung zeigt eine Umgebung, in der einzelne Komponenten in der Data-Warehousing-Umgebung von unten nach oben erstellt werden. Anstatt die Komponenten zu einer großen Datenbank zusammenzufassen (und alle Daten erneut zu kopieren), erstellt EII eine Data-Warehousing-Umgebung, in der Benutzer auf Inhalte jeder Komponente von einem Business Intelligence-Tool zugreifen können, so als ob sie alle zusammen gespeichert wären…
Überlegen Sie, wie Sie einen Webbrowser auf Ihrem Desktop verwenden. Sie klicken entweder auf einen Link oder geben eine bestimmte URL ein, und die Umgebung, die hinter den Kulissen arbeitet, bringt Sie an den richtigen Ort für den gewünschten Inhalt. Stellen Sie sich jetzt vor, dass das Internet viel schneller läuft.
Wenn Sie zu verschiedenen Websites gehen, greifen Sie nicht auf Anzeigen für den neuesten Allradantrieb zu, den Sie begehrt haben, auf Sportergebnisse, Dilbert-Cartoons oder was Sie sonst noch im Internet tun.Sie bringen Daten zurück, die dann kombiniert und an Ihren Browser zurückgesendet werden. Das ist virtuelles Data Warehousing - es ist wie das Internet!
Es ist keine gute Idee, eine virtuelle Data Warehousing-Umgebung zu erstellen, um direkt auf die Quelldaten in ihrem nativen Format zugreifen zu können. Ihre Herausforderung besteht nicht darin, herauszufinden, wie plattformübergreifende Datenbanken verbunden werden (z. B. die Kombination von IMS-Daten mit DB2-Daten) und wie diese Transformationen auf Systemebene gehandhabt werden. Dadurch wird sichergestellt, dass die Qualität der Daten hoch ist und nicht erforderlich ist. Der Benutzer muss die Daten manuell bereinigen.
Jede Anwendung sollte daher lagerfähig sein und einen Datenverleger enthalten, der für alle Middleware-Dienste (wie Extraktion und Qualitätssicherung) verantwortlich ist, wie in den Geschäftsregeln der Umgebung festgelegt.
Der Datenverleger könnte möglicherweise fast im Echtzeitmodus arbeiten, wie er es in einem Betriebsdatenspeicher tun müsste, oder er könnte in einem periodischen (chargenorientierten) Modus arbeiten, wenn keine sofortigen Aktualisierungen erforderlich sind. In dieser Situation ist der Datenpublisher ein Mini-Middleware-Produkt, das in die Anwendung eingebettet ist (oder ein Dienst, auf den die Anwendung zugreift).
Wenn Sie an virtuelles Data Warehousing denken, ersetzen Sie die Frage "Kann ich zu den Daten gelangen? "Mit der Frage" Kann ich zu brauchbaren Daten gelangen? "Der Datenverleger spielt eine wichtige Rolle und sollte nicht vernachlässigt werden.
Sie dürfen auch die Datenarchitektur nicht vernachlässigen. Nur weil Sie Komponenten nach dem Bottom-up-Prinzip entwickeln und statt auf eine größere Data-Warehouse-Datenbank auf sie zugegriffen wird, bedeutet dies nicht, dass Sie diese Funktion vernachlässigen können.
Angenommen, eine Komponente speichert Kunden-IDs als fünfstellige Zahlen nach der Umwandlung und enthält nur Kunden, die innerhalb der letzten sechs Monate eingekauft haben. Und eine weitere Komponente, die alle Kunden enthält, die jemals Produkte Ihres Unternehmens gekauft haben, verwendet siebenstellige alphanumerische Identifikatoren. In dieser Situation haben Sie möglicherweise die gleichen Datenkonfliktprobleme wie beim direkten Zugriff auf Daten aus den Quellen.
Obwohl EII Unterschiede zwischen Komponenteninhalten zulässt, müssen Sie die Unterschiede verstehen und verwalten, damit Sie die Business-Intelligence-Mission nicht behindern.
