Zuhause Persönliche Finanzen Die Rolle der traditionellen ETL in Big Data - Dummies

Die Rolle der traditionellen ETL in Big Data - Dummies

Video: AWS Tutorial For Beginners | AWS Full Course - Learn AWS In 10 Hours | AWS Training | Edureka 2025

Video: AWS Tutorial For Beginners | AWS Full Course - Learn AWS In 10 Hours | AWS Training | Edureka 2025
Anonim

ETL-Tools kombinieren drei wichtige Funktionen (Extrahieren, Transformieren, Laden), um Daten aus einer Big Data-Umgebung zu erhalten. und legen es in eine andere Datenumgebung. Traditionell wurde ETL für die Stapelverarbeitung in Data Warehouse-Umgebungen verwendet. Data Warehouses bieten Geschäftsanwendern eine Möglichkeit, Informationen zu konsolidieren, um Daten zu analysieren und zu berichten, die für ihren Geschäftsfokus relevant sind. ETL-Tools wandeln Daten in das von Data Warehouses benötigte Format um.

Die Transformation wird tatsächlich an einem Zwischenstandort durchgeführt, bevor die Daten in das Data Warehouse geladen werden. Viele Softwareanbieter, darunter IBM, Informatica, Pervasive, Talend und Pentaho, bieten ETL-Softwaretools an.

ETL stellt die zugrunde liegende Infrastruktur für die Integration bereit, indem es drei wichtige Funktionen ausführt:

  • Extrahieren: Daten aus der Quelldatenbank lesen.

  • Transformieren: Konvertiert das Format der extrahierten Daten so, dass es den Anforderungen der Zieldatenbank entspricht. Die Transformation erfolgt durch die Verwendung von Regeln oder das Zusammenführen von Daten mit anderen Daten.

  • Laden: Daten in die Zieldatenbank schreiben.

ETL entwickelt sich jedoch weiter, um die Integration über weit mehr als herkömmliche Data Warehouses hinweg zu unterstützen. ETL kann die Integration über Transaktionssysteme, Betriebsdatenspeicher, BI-Plattformen, MDM-Hubs, Cloud- und Hadoop-Plattformen hinweg unterstützen. ETL-Softwareanbieter erweitern ihre Lösungen, um Big Data-Extraktion, -Umwandlung und -Ladung zwischen Hadoop und herkömmlichen Datenmanagementplattformen zu ermöglichen.

ETL und Softwaretools für andere Datenintegrationsprozesse wie Datenbereinigung, Profilerstellung und Auditing arbeiten an verschiedenen Aspekten der Daten, um sicherzustellen, dass die Daten als vertrauenswürdig gelten. ETL-Tools lassen sich in Datenqualitätstools integrieren, und viele enthalten Tools für die Datenbereinigung, die Datenzuordnung und die Ermittlung der Datenabstammung. Mit ETL extrahieren Sie nur die Daten, die Sie für die Integration benötigen.

ETL-Tools werden für das Laden und Konvertieren von strukturierten und unstrukturierten Daten in Hadoop benötigt. Fortgeschrittene ETL-Tools können mehrere Dateien parallel von und zu Hadoop lesen und schreiben, um die Zusammenführung von Daten in einen gemeinsamen Transformationsprozess zu vereinfachen. Einige Lösungen enthalten Bibliotheken von vordefinierten ETL-Transformationen für die Transaktions- und Interaktionsdaten, die auf Hadoop oder einer herkömmlichen Grid-Infrastruktur ausgeführt werden.

Bei der Datentransformation wird das Datenformat geändert, sodass es von verschiedenen Anwendungen verwendet werden kann.Dies kann eine Änderung von dem Format, in dem die Daten gespeichert sind, in das Format bedeuten, das von der Anwendung benötigt wird, die die Daten verwenden wird. Dieser Prozess enthält auch Mapping -Befehle, so dass Anwendungen erfahren, wie sie die zu verarbeitenden Daten erhalten.

Der Prozess der Datentransformation wird aufgrund des erstaunlichen Wachstums der Menge an unstrukturierten Daten sehr viel komplexer. Eine Geschäftsanwendung, z. B. ein Kundenbeziehungsmanagement, hat bestimmte Anforderungen für die Speicherung von Daten. Die Daten sind wahrscheinlich strukturiert in den organisierten Zeilen und Spalten einer relationalen Datenbank. Daten sind semi-strukturiert oder unstrukturiert , wenn sie nicht starren Formatanforderungen entsprechen.

Die in einer E-Mail-Nachricht enthaltenen Informationen gelten z. B. als unstrukturiert. Einige der wichtigsten Informationen eines Unternehmens sind unstrukturierte und semi-strukturierte Formulare wie Dokumente, E-Mail-Nachrichten, komplexe Messaging-Formate, Interaktionen mit dem Kundensupport, Transaktionen und Informationen aus verpackten Anwendungen wie ERP und CRM.

Datentransformations-Tools sind nicht dafür ausgelegt, mit unstrukturierten Daten zu arbeiten. Infolgedessen mussten Unternehmen, die unstrukturierte Informationen in ihre Geschäftsprozessentscheidungen einbinden mussten, mit einem erheblichen Anteil an manueller Codierung arbeiten, um die erforderliche Datenintegration zu erreichen.

In Anbetracht des Wachstums und der Bedeutung unstrukturierter Daten für die Entscheidungsfindung bieten ETL-Lösungen von großen Anbietern nun standardisierte Ansätze für die Transformation unstrukturierter Daten, damit diese einfacher in operative strukturierte Daten integriert werden können.

Die Rolle der traditionellen ETL in Big Data - Dummies

Die Wahl des Herausgebers

Unter Verwendung von Taschenrechnern auf den SAT - Dummies

Unter Verwendung von Taschenrechnern auf den SAT - Dummies

Wenn Sie den SAT benutzen, dürfen Sie einen Taschenrechner benutzen. Taschenrechner können viel Zeit am SAT sparen, wenn Sie sie speichern, wenn Sie nicht schnell und einfach eine Berechnung im Kopf durchführen können. Je komplizierter eine einzelne Berechnung ist, desto wahrscheinlicher ist es, dass Sie sie falsch eingeben, also wenn ...

UKCAT für Dummies Cheat Sheet (UK Edition) - Dummies

UKCAT für Dummies Cheat Sheet (UK Edition) - Dummies

Erfolgreicher Einsatz in der Medizin oder Zahnmedizin Kurse im Vereinigten Königreich hängen oft von einer guten Punktzahl im britischen Clinical Aptitude Test (UKCAT) ab. Es ist eine ziemlich neue Prüfung, die dein angeborenes Talent misst, mit den Arten von Material umzugehen, die du während des Trainings lernen wirst. Behalten Sie diese Informationen zur Hand, um Ihre ...

Mit der Tabelle der Freude, um mit Numeracy Tests zu helfen - Dummies

Mit der Tabelle der Freude, um mit Numeracy Tests zu helfen - Dummies

Hier ist, wie man meine verwenden Ein toller Table of Joy, um Prozentsätze, Tortendiagramme, Proportionen, Conversions, Quoten und den Rest zu erarbeiten, damit Sie Ihren Rechenleistungstest mit Leichtigkeit absolvieren können! Zeichnen Sie große Nullen und überqueren Sie das Raster, so dass Sie in der ersten Spalte und in der oberen Reihe genügend Platz für Etiketten haben. Label the top-middle ...

Die Wahl des Herausgebers

Verwendet, wie man Schnelle Analyse in Excel 2016 - Dummies

Verwendet, wie man Schnelle Analyse in Excel 2016 - Dummies

Verwendet, wenn Sie eine schnelle Analyse Ihres Daten in Excel 2016, verwenden Sie die Funktion "Schnellanalyse". Hier einige Punkte, die Sie bei der Schnellanalyse beachten sollten: Wenn Sie einen Zellenbereich auswählen, wird ein kleines Symbol in der unteren rechten Ecke des ausgewählten Bereichs angezeigt. Dies ist der Quick ...

Verwendung von logischen Funktionen in Excel 2010 Formeln - Dummies

Verwendung von logischen Funktionen in Excel 2010 Formeln - Dummies

Excel 2010 verwendet sieben logische Funktionen - UND , FALSE, IF, IFERROR, NOT, OR und TRUE - die im Dropdown-Menü der logischen Befehlsschaltfläche auf der Registerkarte "Formeln" der Multifunktionsleiste angezeigt werden. Alle logischen Funktionen geben entweder den logischen TRUE oder den logischen FALSE zurück, wenn ihre Funktionen ausgewertet werden. Hier sind die Namen der ...

Verwendung von Office-Add-Ins in Excel 2016 - Dummies

Verwendung von Office-Add-Ins in Excel 2016 - Dummies

Excel 2016 unterstützt die Verwendung von Office-Add-Ins zum Erstellen von Arbeitsblättern Office-Add-Ins sind kleine Anwendungsprogramme, die in bestimmten Office 2016-Programmen wie z. B. Excel ausgeführt werden und bestimmte Funktionen erhöhen, um eine höhere Produktivität zu erzielen. Es gibt Office-Add-Ins, die Ihnen helfen, die Funktionen von Excel kennenzulernen, Wörter im Merriam-Webster nachzuschlagen ...

Die Wahl des Herausgebers

Bedingtes Zählen in Excel 2010 mit COUNTIF - Dummies

Bedingtes Zählen in Excel 2010 mit COUNTIF - Dummies

Excel 2010 bietet eine Auswahl an Zählfunktionen - inklusive COUNT, COUNTA, COUNTBLANK und COUNTIF - in der Kategorie "Statistik", mit der Sie die Anzahl der Zellen zählen können, die numerische Werte enthalten, nicht leer sind (also Einträge beliebiger Art enthalten) oder deren Werte die von Ihnen angegebenen Kriterien erfüllen. Sie finden ...

Zirkuläre Referenzen in Excel 2013 - Dummies

Zirkuläre Referenzen in Excel 2013 - Dummies

Ein zirkulärer Verweis in einer Excel 2013-Formel ist eine davon direkt oder indirekt , auf seinen eigenen Wert. Der häufigste Typ der zirkulären Referenz tritt auf, wenn Sie in der Formel irrtümlicherweise auf die Zelle verweisen, in der Sie die Formel selbst erstellen. Angenommen, die Zelle B10 ist aktiv, wenn Sie bauen ...

Excel 2007 Formelberechnungen manuell steuern - Dummies

Excel 2007 Formelberechnungen manuell steuern - Dummies

Standardmäßig berechnet Excel 2007 Ihre Formeln automatisch, wenn sie eingegeben werden oder wenn Sie das Arbeitsblatt ändern. Sie können bei Bedarf zur manuellen Berechnung wechseln. Die automatische Einstellung ist normalerweise kein Problem, aber wenn Sie an einer umfangreichen Arbeitsmappe mit vielen Berechnungen arbeiten, müssen Sie diese möglicherweise überdenken. ...