Zuhause Persönliche Finanzen Big Data Analysis und das Data Warehouse - Dummies

Big Data Analysis und das Data Warehouse - Dummies

Inhaltsverzeichnis:

Video: Big Data in 3 Minuten erklärt 2025

Video: Big Data in 3 Minuten erklärt 2025
Anonim

Sie werden einen Mehrwert darin finden, die Fähigkeiten des Data Warehouse und der Big Data-Umgebung zusammenzubringen. Sie müssen eine Hybridumgebung erstellen, in der Big Data mit dem Data Warehouse zusammenarbeiten kann.

Zunächst ist es wichtig zu erkennen, dass sich das Data Warehouse, wie es heute entworfen wird, kurzfristig nicht ändern wird.

Daher ist es pragmatischer, das Data Warehouse für das zu verwenden, wofür es entworfen wurde - eine gut überprüfte Version der Wahrheit über ein Thema bereitzustellen, das das Unternehmen analysieren möchte. Das Lager kann Informationen über die Produktlinie eines bestimmten Unternehmens, seine Kunden, seine Lieferanten und die Details der Transaktionen eines Jahres enthalten.

Die im Data Warehouse oder einem Abteilungs-Data-Mart verwalteten Informationen wurden sorgfältig konstruiert, damit die Metadaten korrekt sind. Mit dem Wachstum neuer webbasierter Informationen ist es praktisch und oft notwendig, diese gewaltige Datenmenge im Zusammenhang mit historischen Daten zu analysieren. Hier kommt das Hybridmodell ins Spiel.

Bestimmte Aspekte der Verknüpfung des Data Warehouse mit Big Data können relativ einfach sein. Beispielsweise stammen viele der großen Datenquellen aus Quellen, die ihre eigenen gut gestalteten Metadaten enthalten. Komplexe E-Commerce-Sites enthalten wohldefinierte Datenelemente. Daher arbeitet die Informationsmanagementorganisation bei der Analyse zwischen dem Warehouse und der Big Data-Quelle mit zwei Datensätzen mit sorgfältig entworfenen Metadatenmodellen, die rationalisiert werden müssen.

In einigen Situationen fehlen den Informationsquellen natürlich explizite Metadaten. Bevor ein Analyst die historischen Transaktionsdaten mit den weniger strukturierten Big Data kombinieren kann, muss Arbeit geleistet werden. Typischerweise wird eine anfängliche Analyse von Petabytes von Daten interessante Muster aufdecken, die dabei helfen können, subtile Veränderungen in der Geschäftstätigkeit oder potenzielle Lösungen für die Diagnose eines Patienten vorherzusagen.

Die anfängliche Analyse kann mithilfe von Tools wie MapReduce mit dem verteilten Dateisystem-Framework von Hadoop abgeschlossen werden. An diesem Punkt können Sie beginnen zu verstehen, ob es in der Lage ist, bei der Beurteilung des Problems zu helfen.

Im Prozess der Analyse ist es ebenso wichtig, unnötige Daten zu eliminieren, wie Daten für den Geschäftskontext zu identifizieren. Wenn diese Phase abgeschlossen ist, müssen die verbleibenden Daten transformiert werden, damit die Metadatendefinitionen präzise sind. Auf diese Weise werden die Ergebnisse genau und aussagekräftig sein, wenn die Big Data mit traditionellen historischen Daten aus dem Lager kombiniert werden.

Der Big-Data-Integrations-Lynchpin

Dieser Prozess erfordert eine wohldefinierte Datenintegrationsstrategie. Während die Datenintegration ein entscheidendes Element bei der Verwaltung von Big Data ist, ist sie bei der Erstellung einer Hybridanalyse mit dem Data Warehouse gleichermaßen wichtig. Tatsächlich ist der Prozess des Extrahierens von Daten und des Transformierens in einer hybriden Umgebung sehr ähnlich wie die Ausführung dieses Prozesses in einem traditionellen Data Warehouse.

Im Data Warehouse werden Daten aus traditionellen Quellsystemen wie CRM- oder ERP-Systemen extrahiert. Es ist wichtig, dass Elemente aus diesen verschiedenen Systemen korrekt aufeinander abgestimmt sind.

Extrahieren, Umwandeln und Laden von Daten für Data Warehouses

Im Data Warehouse finden Sie häufig eine Kombination aus relationalen Datenbanktabellen, flachen Dateien und nicht relationalen Quellen. Ein gut konstruiertes Data Warehouse wird so strukturiert, dass die Daten in ein gemeinsames Format konvertiert werden, sodass Abfragen präzise und konsistent verarbeitet werden können. Die extrahierten Dateien müssen so transformiert werden, dass sie den Geschäftsregeln und -prozessen des Themenbereichs entsprechen, den das Data Warehouse analysieren soll.

Mit anderen Worten müssen die Daten aus den großen Datenquellen extrahiert werden, damit diese Quellen sicher zusammenarbeiten und aussagekräftige Ergebnisse liefern können. Darüber hinaus müssen die Quellen so transformiert werden, dass sie hilfreich bei der Analyse der Beziehung zwischen den historischen Daten und den dynamischeren und Echtzeitdaten sind, die aus Big Data-Quellen stammen.

Das Laden von Informationen in das Big Data-Modell unterscheidet sich von dem, was Sie in einem traditionellen Data Warehouse erwarten würden. Bei Data Warehouses ändert sich die Codierung nach der Codierung nie. Ein typisches Data Warehouse wird dem Unternehmen eine Momentaufnahme von Daten liefern, die auf der Notwendigkeit basieren, ein bestimmtes geschäftliches Problem zu analysieren, das überwacht werden muss, z. B. Inventar oder Vertrieb.

Die verteilte Struktur von Big Data führt Organisationen häufig dazu, zunächst Daten in eine Reihe von Knoten zu laden und dann die Extraktion und Transformation durchzuführen. Bei der Erstellung eines Hybrids aus dem traditionellen Data Warehouse und der Big Data-Umgebung kann die verteilte Natur der Big Data-Umgebung die Fähigkeit von Organisationen drastisch verändern, große Datenmengen im Zusammenhang mit dem Unternehmen zu analysieren.

Big Data Analysis und das Data Warehouse - Dummies

Die Wahl des Herausgebers

Anzeigen von elektrischen Signalen an einem Oszilloskop - Dummies

Anzeigen von elektrischen Signalen an einem Oszilloskop - Dummies

Ein Oszilloskop ermöglicht das Anzeigen eines elektrischen Signals durch Anzeigen einer Spannung. variiert mit der Zeit als eine Spur über eine Anzeige. Die vertikale Achsenspannung zeigt die Größe der Spannung (auch Amplitude genannt) an, und die horizontale Achse repräsentiert die Zeit. (Denken Sie daran, Gleichungen in Mathematik-Klasse zu zeichnen? Nun, die Anzeige auf einem Bereich ist wirklich ...

Eintauchen in DX-ing - Dummies

Eintauchen in DX-ing - Dummies

Drücken Sie Ihre Station, um Kontakte über immer größere Entfernungen herzustellen (DX bedeutet entfernte Stationen ist die zweitälteste Aktivität im gesamten Amateurfunk. Irgendwo im Äther ist eine Station immer nur verlockend außer Reichweite und die Herausforderung, diese Station zu kontaktieren, ist der Zweck von DX-ing. Tausende von Schinken über ...

Steuern Sie Ihre Elektronik über einen Parallelport - Dummies

Steuern Sie Ihre Elektronik über einen Parallelport - Dummies

Werfen Sie nicht weg alter Computer! Wenn es einen Parallelport hat, können Sie damit Ihre elektronischen Gadgets steuern. Bis vor einigen Jahren waren alle Computer mit einem parallelen Anschluss ausgestattet, der hauptsächlich zum Anschluss an einen Drucker verwendet wurde. Heutzutage verbinden sich die meisten Drucker über USB-Ports mit Computern. Der Parallelport ...

Die Wahl des Herausgebers

Neuro-linguistisches Programmieren: Zu Deinem Selbst Selbst Seien Wahr - Attrappen

Neuro-linguistisches Programmieren: Zu Deinem Selbst Selbst Seien Wahr - Attrappen

Fahren nicht durch dein Leben mit einem Fuß auf der Bremse, weil du versuchst, den Erwartungen anderer Menschen gerecht zu werden. Persönliche Verantwortung und echtes Autofahren ist viel einfacher, wenn man versteht, wer man im Mittelpunkt steht und was man im Leben erreichen will. Sie können Maßnahmen ergreifen, wenn Sie ...

Bewegen Jenseits von Typ A: Abheben der Uhr - Dummies

Bewegen Jenseits von Typ A: Abheben der Uhr - Dummies

Typ A sind von der Zeit besessen. "Das nimmt zu viel Zeit in Anspruch" "Verdammt, es wird spät - ich werde nie pünktlich fertig sein." "Ich wünschte, sie würden sich beeilen. "Typ A hat ein beschleunigtes Zeitgefühl. Sie fühlen, wie die Zeit im Laufe des Tages immer mehr "abrutscht". Dies führt zu einem ...

Stimmung Störungen und ihre Behandlung Medikamente - Dummies

Stimmung Störungen und ihre Behandlung Medikamente - Dummies

Stimmungsstörungen, auch als affektive Störungen bekannt, sind eine Gruppe von Krankheiten gekennzeichnet durch eine deutliche Veränderung des emotionalen Zustandes einer Person. Die drei häufigsten Stimmungsstörungen sind bipolare Störung, Dysthymie und Major Depression. Stimmungsstörungen betreffen fast 21 Prozent der Erwachsenen in den Vereinigten Staaten. Die meisten Betroffenen finden jedoch ein gewisses Maß an ...

Die Wahl des Herausgebers

So ​​wählen Sie die von Ihnen benötigten AWS-Dienste aus - Attrappen

So ​​wählen Sie die von Ihnen benötigten AWS-Dienste aus - Attrappen

Denken Sie daran, dass Sie nur 12 Monate frei haben Entscheidungsprozess darüber, welche AWS-Dienste (Amazon Web Services) in Ihrem Unternehmen verwendet werden sollen. Zwölf Monate mögen sehr viel Zeit in Anspruch nehmen, aber Sie werden feststellen, dass es vor Ihren Augen verdunstet, wenn Sie versuchen, Ihre täglichen Aufgaben, Meetings, ... zu bewältigen.

Amazon Web Services für Dummies Cheat Sheet - Dummies

Amazon Web Services für Dummies Cheat Sheet - Dummies

Amazon Web Services (AWS) ist ein Cloud-Dienstanbieter, der bietet einfachen Zugriff auf eine Vielzahl von nützlichen Computerressourcen, die alle auf bedarfsgerechte, kosteneffiziente Weise angeboten werden. Wenn Sie ein IT-Praktiker sind, der bereit ist, Amazon Web Services zu nutzen, brechen Sie Ihre alten Anwendungsmuster-Gewohnheiten und implementieren Sie neue Ansätze, die AWS-Eigenschaften und ...

AWS-Sicherheitsprobleme - Dummies

AWS-Sicherheitsprobleme - Dummies

Für die Verwendung von AWS (Amazon Web Services) müssen Sie die Sicherheit Ihres Computers in einem Weg. Administratoren und Sicherheitsexperten können sich schnell verrückt machen, wenn sie versuchen, diese miteinander verbundenen Computer sicher zu halten, aber das ist Teil der Stellenbeschreibung. Sie müssen Best Practices bei der Sicherung der Computersysteme und der darin enthaltenen Daten befolgen.