Zuhause Persönliche Finanzen Hadoop als abfragbares Archiv von Cold Warehouse Daten - Dummies

Hadoop als abfragbares Archiv von Cold Warehouse Daten - Dummies

Video: HDInsight: Fast Interactive Queries with Hive on LLAP | Azure Friday 2025

Video: HDInsight: Fast Interactive Queries with Hive on LLAP | Azure Friday 2025
Anonim

genannt) eine Vielzahl von Studien zeigen, dass die meisten Daten in einem Enterprise Data Warehouse selten abgefragt werden. Datenbankanbieter haben auf solche Beobachtungen geantwortet, indem sie ihre eigenen Methoden implementierten, um zu sortieren, welche Daten wo platziert werden.

Eine Methode ordnet das Datenuniversum in Bezeichnungen von warm, warm oder kalt, wobei heiß Daten (manchmal aktiv Daten genannt wird häufig verwendet, warm Daten werden von Zeit zu Zeit verwendet und kalt Daten wird selten verwendet. Die vorgeschlagene Lösung für viele Anbieter ist die kalten Daten auf langsameren Festplatten in den Data Warehouse-Gehäusen zu speichern oder clevere Caching-Strategien zu erstellen, um die heißen Daten im Speicher zu halten, unter anderem.

Das Problem bei diesem Ansatz ist, dass, obwohl langsamer Speicher verwendet wird, es immer noch teuer ist, kalte, selten benutzte Daten in einem Lagerhaus zu speichern. Lizenzierung von Hardware und Software. Gleichzeitig werden kalte und ruhende Daten oft auf Band archiviert.

Dieses traditionelle Archivierungsmodell bricht zusammen, wenn Sie alle kalte Daten kosteneffizient und relativ effizient abfragen wollen - ohne alte Bänder anzufordern.

Wenn Sie sich die Kosten und die Betriebseigenschaften von Hadoop ansehen, scheint es tatsächlich das neue Backup-Band zu werden. Hadoop ist vor allem deshalb preiswert, weil Hadoop-Systeme so konzipiert sind, dass sie einen geringeren Hardware-Grad verwenden als normalerweise in Data-Warehouse-Systemen. Eine weitere signifikante Kosteneinsparung ist die Softwarelizenzierung.

Kommerzielle Hadoop-Distributionslizenzen erfordern einen Bruchteil der Kosten von relationalen Data-Warehouse-Softwarelizenzen, die dafür berüchtigt sind, teuer zu sein. Aus betrieblicher Sicht ist Hadoop so konzipiert, dass es einfach skaliert werden kann, indem einem vorhandenen Cluster zusätzliche Slave-Knoten hinzugefügt werden. Und da Slave-Knoten hinzugefügt werden und Datensätze immer umfangreicher werden, ermöglichen die Datenverarbeitungs-Frameworks von Hadoop Ihren Anwendungen, die erhöhte Arbeitslast nahtlos zu bewältigen.

Hadoop stellt eine einfache, flexible und kostengünstige Möglichkeit dar, die Verarbeitung über buchstäblich Tausende von Servern zu beschleunigen.

Mit seiner skalierbaren und kostengünstigen Architektur scheint Hadoop die perfekte Wahl für die Archivierung von Warehouse-Daten zu sein … abgesehen von einer kleinen Sache: Der größte Teil der IT-Welt läuft auf SQL, und SQL allein ist nicht gut mit Hadoop kompatibel…

Sicherlich ist die Hadoop-freundliche NoSQL-Bewegung am Leben und gut, aber die meisten Power-User verwenden jetzt SQL mit üblichen, standardmäßigen Toolsets, die SQL-Abfragen unter der Haube erzeugen - Produkte wie Tableau, Microsoft Excel und IBM Cognos BI.

Es stimmt, dass das Hadoop-Ökosystem Hive enthält, aber Hive unterstützt nur eine Untermenge von SQL, und obwohl sich die Leistung verbessert (zusammen mit der SQL-Unterstützung), ist es bei der Beantwortung kleinerer Anfragen nicht annähernd so schnell wie bei relationalen Systemen. In letzter Zeit gab es große Fortschritte beim SQL-Zugriff auf Hadoop, wodurch Hadoop zum neuen Ziel für Online-Data-Warehouse-Archive wurde.

Je nach Hadoop-Anbieter werden SQL- (oder SQL-ähnliche) APIs verfügbar, sodass die gängigen Reporting- und Analysetools SQL-Standards für die Ausführung von Daten ausgeben können. Hadoop. Zum Beispiel hat IBM seine Big SQL API, Cloudera Impala und Hive selbst, über die Hortonworks Stinger Initiative, wird zunehmend SQL-konform.

Obwohl es verschiedene Sichtweisen gibt (einige zielen darauf ab, Hive zu erweitern, einige, Hive zu erweitern und andere, eine Alternative zu bieten), versuchen all diese Lösungen, zwei Probleme anzugehen: MapReduce ist eine schlechte Lösung für die Ausführung kleinerer Abfragen. Der SQL-Zugriff ist vorerst der Schlüssel dafür, dass IT-Mitarbeiter ihre vorhandenen SQL-Kenntnisse nutzen können, um die in Hadoop gespeicherten Daten zu optimieren.

Hadoop als abfragbares Archiv von Cold Warehouse Daten - Dummies

Die Wahl des Herausgebers

Photoshop 7 Navigationswerkzeuge - dummies

Photoshop 7 Navigationswerkzeuge - dummies

Photoshop 7 bietet alle Möglichkeiten, durch die Funktionen zu navigieren, egal ob Sie eine Mac oder ein Windows-System. In der folgenden Tabelle finden Sie Informationen zum Scrollen, Zoomen und Durchlaufen von Photoshop 7: Action Windows Mac Scrollen Sie mit der Leertaste + ziehen Sie die Leertaste + Strg + Leertaste + klicken Sie auf Apple Command + Leertaste + klicken Sie auf Vergrößern und ändern ...

Photoshop 7 Mal- und bearbeitungswerkzeuge - dummies

Photoshop 7 Mal- und bearbeitungswerkzeuge - dummies

In Photoshop 7 sind die Tastenkombinationen für Mal- und Bearbeitungswerkzeuge meist das Gleiche, ob Sie ein Windows-basiertes System oder einen Mac verwenden. Der einzige Unterschied besteht im letzten Eintrag in der folgenden Tabelle, in der die Verknüpfungen angezeigt werden: Erhöhen der Pinselgröße] Verringern der Pinselgröße [Ändern der Deckkraft oder des Werkzeugflusses 1, ...

Photoshop 7 Paletten-Werkzeuge - Dummies

Photoshop 7 Paletten-Werkzeuge - Dummies

Die Paletten von Photoshop 7 geben Ihnen Zugriff auf Gruppen verwandter Werkzeuge. Wenn Sie sich also auf Farbe konzentrieren, können Sie die Farbpalette aufziehen und Ihre Photoshop-Bilder mit einem Regenbogen von Schattierungen beleben. Die folgende Tabelle zeigt den Zugriff auf die verschiedenen Photoshop 7-Paletten in Windows- und Mac-Systemen: Palette / Aktion ...

Die Wahl des Herausgebers

Fantasy Fußball für Dummies Cheat Sheet - Dummies

Fantasy Fußball für Dummies Cheat Sheet - Dummies

Fantasy Fußball ist ein Spaß, wettbewerbsfähig und süchtig machendes Hobby. Bringen Sie Ihre Fantasy-Saison in Schwung, indem Sie Spieler entwerfen, um ein solides Team aufzubauen und Coaching-Tipps verwenden, um Ihr Team stark zu machen. Wenn Sie eine Position verbessern müssen, probieren Sie einige Strategien für den Handel mit Spielern und den Erwerb freier Agenten aus. Halten Sie einen Führer handlich von ...

Wie Fantasy-Fußball-Playoffs funktionieren - Dummies

Wie Fantasy-Fußball-Playoffs funktionieren - Dummies

Wenn du das Ende deiner Fantasy-Football-Saison erreichst, wenn sie vorbei ist Nun, Sie sind vielleicht im Streit, um die Playoffs zu machen. Wenn das der Fall ist, herzlichen Glückwunsch! Mit diesen Rechten geht es um dieses Spiel, und Sie sind dem ultimativen Preis einen Schritt näher. Wenn nicht, fühle dich nicht schlecht. ...

Bereiten Sie Ihre Fantasy Football Roster für die Draft - Dummies

Bereiten Sie Ihre Fantasy Football Roster für die Draft - Dummies

Vor, wenn Sie Ihre Fantasy Football League erforschen und herausfinden Wie viele Dienstplan-Spots Sie haben, können Sie Ihre Aufmerksamkeit darauf lenken, Ihren Entwurf basierend auf diesen Anforderungen vorzubereiten. Sie können Ihren eigenen Dienstplan-Spickzettel aus CheatSheet War Room ausdrucken. Neben dem Listenblatt finden Sie weitere kostenlose druckbare Fantasy-Fußball ...

Die Wahl des Herausgebers

Erstellen eines neuen Dokuments aus CSS-Starterseiten in Dreamweaver CS6 - Dummies

Erstellen eines neuen Dokuments aus CSS-Starterseiten in Dreamweaver CS6 - Dummies

Adobe Dreamweaver CS6 bietet Ihnen eine Bibliothek von Beispielseiten mit CSS-basierten Layouts als Alternative zum Neuanfang. Diese CSS-Beispielseiten enthalten nützliche und allgemeine Layoutideen, und da sie mit CSS-Positionierung erstellt werden, sind sie sehr flexibel. Sie können sie direkt im Bedienfeld "CSS-Stile" oder im Eigenschafteninspektor ändern. ...