Zuhause Persönliche Finanzen Datenextraktion, Bewegung und Laden für Data Warehouse Deluxe - Dummies

Datenextraktion, Bewegung und Laden für Data Warehouse Deluxe - Dummies

Video: AutoCAD Datenextraktion 2024

Video: AutoCAD Datenextraktion 2024
Anonim

Data Warehouse Deluxe-Implementierungen sind groß - und werden immer größer. Implementierungen, die Hunderte von Gigabytes (ein Gigabyte entspricht 1 Milliarde Byte) und sogar Terabytes (1 Billion Byte) verwenden, werden zunehmend häufiger. Um dieses Datenvolumen und den Benutzerzugriff zu verwalten, benötigen Sie einen sehr robusten Server und eine Datenbank.

Bereiten Sie sich auf die Herausforderung vor! Mit einem Data Warehouse lite können Sie normalerweise Datenbewegungen von einer Quelle zur anderen auf einfache Art und Weise bewältigen - mit dem Data Warehouse deluxe betreten Sie jetzt die Difficulty Zone, in der viele Data Warehousing-Projekte ihre Waterloo.

Sie haben wahrscheinlich aus verschiedenen Gründen Schwierigkeiten in dieser Domäne:

  • Sie haben es mit vielen verschiedenen Datenquellen zu tun, von denen einige überlappende Daten enthalten können. Beispielsweise können Lieferanteninformationen von zwei verschiedenen Einkaufssystemen stammen, und einige Ihrer Lieferanten haben Einträge in beiden Systemen.

    Sie werden wahrscheinlich unterschiedliche Identifizierungsgruppen kennenlernen, die Sie konvergieren müssen (z. B. sechs alphanumerische Zeichen, die in einem der Systeme als SUPPLIER_ID identifiziert werden, und eine eindeutige Ganzzahl, die in der anderen als SUP_NUM bekannt ist).

  • Wenn Ihr Data Warehouse groß ist (mehr als 250 Gigabyte), werden Sie wahrscheinlich Schwierigkeiten beim Extrahieren, Verschieben und Laden Ihrer Stapelfenster haben. Stapelfenster , Die Zeitfenster, in denen Aktualisierungen am Lager vorgenommen werden, werden durch die Anzahl der Datenquellen erschwert, die Sie bearbeiten müssen.

  • Die Chancen für einen vermasselten Extraktions-, Verschiebungs-, Transformations- und Ladeprozess hängen exponentiell mit der Anzahl der Datenelemente zusammen, die in das Data Warehouse geladen werden.

    Wenn Sie einen bestimmten Schwierigkeitsfaktor (z. B. eine Ganzzahl) für den Abruf von Daten in das Warehouse festlegen könnten, würden die folgenden Maßnahmen zutreffen: Sie haben n -Daten. Elemente, die Sie mit einem Schwierigkeitsgrad von x in das Data Warehouse aufnehmen möchten. Wenn Sie jetzt 2 n Datenelemente haben, liegt Ihr Schwierigkeitsfaktor nicht bei 2 x; stattdessen ist es x quadratisch.

    Um diesen Schwierigkeitsfaktor verständlicher zu machen, weisen Sie n und x einige Zahlen zu. Nehmen wir an, Ihr Data Warehouse hat 100 Elemente (n) und der Schwierigkeitsfaktor (x) ist 5. Wenn Sie die Anzahl der Elemente verdoppeln ( n > = 200), Ihr Schwierigkeitsfaktor ist 25 (5 Quadrate), nicht 10 (5 x 2). Der Prozess des Umgangs mit so vielen Datenquellen, die alle auf einen Ort (Ihr Data Warehouse deluxe) ausgerichtet sind, hat alle Elemente von zu vielen Köchen in der Küche oder was auch immer dieser Spruch ist.

  • Um den Vorgang des Extrahierens, Verschiebens, Umwandelns und Ladens reibungslos ablaufen zu lassen, müssen Sie wahrscheinlich mit vielen verschiedenen Anwendungseignern, offiziellen Datenbankhaltern und anderen Personen aus verschiedenen Organisationen umgehen, die alle kooperieren, als wären sie Teil eines professionellen Sinfonieorchesters.

    Die Realität ist jedoch, dass sie sich mehr wie eine Gruppe von Kindergartenstudenten verhalten, die jeweils ein Musikinstrument aus der Spielzeugtonne nehmen und ihnen sagen: "Jetzt spielt etwas! "Obwohl der Prozess nicht notwendigerweise zum Scheitern verurteilt ist, erwarten Sie eine Reihe von Iterationen, bis Sie das Data Warehouse Deluxe genau richtig geladen haben.

    Ein Data Warehouse deluxe kann drei Ebenen aufweisen (z. B. eine Data Warehouse-Datei), außer dass mehr Datenquellen und möglicherweise mehr als ein Typ von Benutzer-Tool auf das Warehouse zugreifen. Aber die Architektur für ein Data Warehouse deluxe sieht wahrscheinlich mehr danach aus, was in dieser Abbildung gezeigt wird, mit vielen verschiedenen Sammelpunkten für Daten.

Zusätzlich zu anderen erforderlichen "Wegstationen" für Ihre spezielle Umgebung kann Ihre Umgebung diese Elemente enthalten:

Data mart:

  • Empfängt Teilmengen von Informationen aus dem Data Warehouse deluxe und dient als primärer Zugriffspunkt für Benutzer. Übergangstransformationsstation:

  • Ein Bereich, in dem aus einigen Quellen extrahierte Datensätze einer Art von Transformationsprozess unterzogen werden, bevor sie die Pipeline in Richtung der Datenbank des Lagers verlagern. Qualitätssicherungsstation:

  • Ein Bereich, in dem Datengruppen einer intensiven Qualitätssicherung unterzogen werden, bevor sie in das Data Warehouse verschoben werden.

Datenextraktion, Bewegung und Laden für Data Warehouse Deluxe - Dummies

Die Wahl des Herausgebers

Netzwerkgrundlagen: IPv6-Adresse Vereinfachte Notation - Dummies

Netzwerkgrundlagen: IPv6-Adresse Vereinfachte Notation - Dummies

Bei der Arbeit mit IPv6-Adressen kann es viel Zeit in Anspruch nehmen. schreibe deine Adressen - immerhin sind sie 128 Bit lang. Um das Leben einfacher zu machen, gibt es einige Regeln, die Sie verwenden können, um diese Schreibweise zu verdichten: Führende Nullen in der Adresse sind optional. Für einen Adressblock wäre also 0A45 gleich A45, ...

Netzwerkgrundlagen: IP-Netzwerkklassen - Dummies

Netzwerkgrundlagen: IP-Netzwerkklassen - Dummies

Netzwerkadressierungsarchitektur unterteilt den Adressraum für Internet Protocol Version 4 (IPv4 ) in fünf Adressklassen. Jede Klasse, die in den ersten vier Bits der Adresse codiert ist, definiert entweder eine andere Netzwerkgröße, d.h. e. Anzahl der Hosts für Unicast-Adressen (Klassen A, B, C) oder Multicast-Netzwerk (Klasse D). Die fünfte Klasse (E) address ...

Netzwerkgrundlagen: Netzwerkport Übersicht - Dummys

Netzwerkgrundlagen: Netzwerkport Übersicht - Dummys

In TCP / IP- und UDP-Netzwerken ist ein Port ein Endpunkt eine logische Verbindung. Die Portnummer gibt an, um welchen Port es sich handelt. Port 80 wird beispielsweise für HTTP-Datenverkehr verwendet. Wenn Sie einen Befehl wie netstat -n unter Microsoft Windows oder Linux verwenden, sehen Sie eine Auflistung der lokalen Adressen ...

Die Wahl des Herausgebers

Excel-Dashboards: Wie Sie Ihr erstes Makro aufzeichnen - Dummies

Excel-Dashboards: Wie Sie Ihr erstes Makro aufzeichnen - Dummies

Wenn Sie ein Anfänger auf dem Dashboard sind Automatisierung in Excel ist es unwahrscheinlich, dass Sie den VBA-Code (Visual Basic für Applikationen) von Hand schreiben können, um Makros zu erstellen. Ohne vollständige Kenntnis des Objektmodells und der Syntax von Excel wäre das Schreiben des benötigten Codes für die meisten Anfänger unmöglich. Hier können Sie ein Makro aufzeichnen ...

Excel-Formelberechnungsmodi - Dummys

Excel-Formelberechnungsmodi - Dummys

Standardmäßig ist Excel so eingestellt, dass es automatisch neu berechnet wird. Wenn Sie eine der Zellen ändern, auf die in einer bestimmten Formel verwiesen wird, berechnet Excel diese Formel automatisch neu, sodass ein korrektes Ergebnis basierend auf den Änderungen in den Zellbezügen zurückgegeben wird. Wenn die Formel, die neu berechnet wird, auch als Zellenreferenz in anderen verwendet wird ...

Excel Formelfehler - Dummies

Excel Formelfehler - Dummies

Es ist nicht immer glatt, wenn Sie mit Excel-Formeln arbeiten. Manchmal gibt eine Formel einen Fehlerwert anstelle des erwarteten Werts zurück. Excel hilft Ihnen, das Problem zu identifizieren, indem Sie einen von sieben Fehlerwerten zurückgeben: # DIV / 0! , # N / A, #NAME? , #NULL! , #NUM! , #REF! und #WERT! , erklärt in der folgenden Liste: # DIV / 0! : ...

Die Wahl des Herausgebers

Teilen, Weiterverbreiten und Kommentieren von Google+ Posts - Dummies

Teilen, Weiterverbreiten und Kommentieren von Google+ Posts - Dummies

, Wenn Sie mit der Verwendung und Veröffentlichung beginnen Bei Google+ möchten Sie gelegentlich Links und Bilder teilen, die Beiträge anderer freigeben, ihre Beiträge kommentieren und andere in Ihren eigenen Google+ Beiträgen erwähnen. Vielleicht fragen Sie sich auch, wie Sie andere dazu bringen, Ihre eigenen Beiträge öfter zu kommentieren. Teilen von Links und Bildern in Google+ So geben Sie ein ...

Teilen Ihrer Google+ Posts mit bestimmten Personen - Dummies

Teilen Ihrer Google+ Posts mit bestimmten Personen - Dummies

Beiträge auf Google+ sind ganz einfach und können posten Text, Links, Fotos, Videos und sogar Ihren aktuellen Standort. Der schwierigste Teil des Beitrags auf Google+ besteht darin, auszuwählen, wen Sie Ihren Beitrag sehen möchten. Google+ verwendet Ihre Kreise, um festzulegen, wer Ihre Beiträge sehen kann. Kreise sind etwas einfacher als Listen, weil ...

Taggen von Personen in Google+ Fotos - Dummies

Taggen von Personen in Google+ Fotos - Dummies

Sie können Personen in Ihren Kreisen auf jedem Foto auf Google+ markieren. Wenn Sie eine Person in einem Foto taggen, wird diese Person über ihre Google+ Benachrichtigungen benachrichtigt. Sie können dann das Tag entfernen oder genehmigen, und das Foto wird mit dem Tag des Namens dieser Person darin angezeigt. Um jemanden zu markieren, ...