Video: Agile Data Warehouse Design for Big Data Presentation 2024
Während sich die Welten von Big Data und das traditionelle Data Warehouse überschneiden, ist es unwahrscheinlich, dass sie in nächster Zeit zusammenwachsen. Stellen Sie sich ein Data Warehouse als ein Datensystem für Business Intelligence vor, ähnlich wie ein Customer Relationship Management (CRM) oder ein Buchhaltungssystem. Diese Systeme sind stark strukturiert und für bestimmte Zwecke optimiert. Zusätzlich neigen diese Aufzeichnungssysteme dazu, stark zentralisiert zu sein.
Das Diagramm zeigt einen typischen Ansatz für Datenflüsse mit Lagern und Märkten:
Organisationen werden unweigerlich weiterhin Data Warehouses verwenden, um die Art von strukturierten und operativen Daten zu verwalten, die Datensysteme charakterisieren. Diese Data Warehouses bieten Geschäftsanalysten weiterhin die Möglichkeit, wichtige Daten, Trends usw. zu analysieren. Das Aufkommen von Big Data stellt jedoch sowohl die Rolle des Data Warehouse in Frage als auch einen ergänzenden Ansatz.
Stellen Sie sich die Beziehung zwischen dem Data Warehouse und Big Data als Zusammenführung zu einer hybriden Struktur vor. In diesem Hybridmodell verbleiben die stark strukturierten optimierten Betriebsdaten im streng kontrollierten Data Warehouse, während die hoch verteilten und sich in Echtzeit ändernden Daten von einer Hadoop-basierten (oder ähnlichen NoSQL-) Infrastruktur gesteuert werden.
Es ist unvermeidlich, dass operative und strukturierte Daten in der Welt der Big Data interagieren müssen, in der die Informationsquellen nicht (notwendigerweise) gereinigt oder profiliert wurden. Unternehmen wissen zunehmend, dass sie eine Geschäftsanforderung haben, um traditionelle Data Warehouses mit ihren historischen Geschäftsdatenquellen mit weniger strukturierten und geprüften Big Data-Quellen kombinieren zu können. Ein hybrider Ansatz, der traditionelle und große Datenquellen unterstützt, kann dabei helfen, diese Geschäftsziele zu erreichen.