Zuhause Persönliche Finanzen Verwaltung von Big Data-Technologien in einer Hybrid Cloud - Dummies

Verwaltung von Big Data-Technologien in einer Hybrid Cloud - Dummies

Inhaltsverzeichnis:

Video: HPE Cloud Bank Storage 2025

Video: HPE Cloud Bank Storage 2025
Anonim

Der Begriff Big Data wird häufig in der Welt der hybriden Cloud-Technologie eingesetzt, da immer mehr Daten verarbeitet werden müssen. Die Haupttatsache über Big Data ist, dass sie am Wendepunkt der Workarounds existiert, die Organisationen in der Vergangenheit eingeführt haben, um große Mengen komplexer Daten zu verwalten. Big Data-Technologien ermöglichen es den Menschen, diese Daten tatsächlich zu analysieren und effektiv zu nutzen.

Große Dateneigenschaften

Große Daten haben im Allgemeinen drei Eigenschaften - Volumen, Vielfalt und Geschwindigkeit:

  • Volumen: Big Data hat ein großes Volumen. Es bezieht sich im Allgemeinen auf mindestens mehrere Terabyte an Daten. Viele Big-Data-Implementierungen versuchen Petabytes an Informationen zu analysieren.

    Name Wert
    Byte 10 0
    Gigabyte 10 9 Byte
    Terabyte 10 12 > Bytes Petabyte
    10 15 Bytes Exabyte
    10 18 Bytes
    Sorte:
  • Big Data gibt es in verschiedenen Formen und Größen. Es umfasst diese Arten von Daten: Strukturierte Daten

    • sind die typische Art von Daten, mit denen Analysten umgehen müssen. Es enthält Umsatz und Anzahl der Verkäufe - die Art von Daten, die Sie in eine Datenbank einschließen. Strukturierte Daten werden auch in Produkten wie Sensoren und RFID-Tags neu erzeugt.

      Semistrukturierte Daten
    • haben eine gewisse Struktur, aber nicht so, wie Sie über Tabellen in einer Datenbank nachdenken. Es enthält EDI-Formate und XML. Unstrukturierte Daten

    • umfassen Text, Bild und Audio, einschließlich eines Dokuments, einer E-Mail-Nachricht, eines Tweets oder eines internen Blogs in einem Unternehmen oder im Internet. Unstrukturierte Daten machen etwa 80 Prozent aller Daten aus. Velocity:

  • Dies ist die Geschwindigkeit, mit der sich die Daten bewegen. Denken Sie über Sensoren nach, die jede Millisekunde Daten oder Datenströme von medizinischen Geräten erfassen. Big Data kommt oft in einem Stream zu Ihnen, so dass es eine Echtzeit-Natur hat. Die Cloud ist aufgrund ihres skalierbaren Speichers, ihrer Rechenleistung und ihrer elastischen Ressourcen ein idealer Ort für Big Data. Das Wolkenmodell ist groß angelegt; Verteiltes Computing und eine Reihe von Frameworks und Technologien haben sich herausgebildet, um dieses Modell zu unterstützen, darunter

Apache Hadoop:

  • Eine in Java geschriebene Open Source Distributed Computing Plattform. Es ist eine Softwarebibliothek, die eine verteilte Verarbeitung über Cluster von Computern ermöglicht. Es ist wirklich ein verteiltes Dateisystem. Es wird ein Computerpool mit jeweils einem Hadoop-Dateisystem erstellt. Hadoop wurde entwickelt, um große Mengen komplexer Daten zu verarbeiten.Die Daten können strukturiert, unstrukturiert oder semistrukturiert sein. Hadoop kann auf vielen Servern ausgeführt werden, die keinen gemeinsamen Speicher oder keine gemeinsame Festplatte verwenden. Weitere Informationen finden Sie unter Hadoop. MapReduce:

  • Ein von Google eingeführtes Software-Framework zur Unterstützung der verteilten Datenverarbeitung auf großen Datensätzen. Es ist das Herz dessen, was Hadoop mit Big Data und Big Data Analytics macht. Es wurde entwickelt, um Cloud-Ressourcen zu nutzen. Diese Berechnung erfolgt über zahlreiche Computer, sogenannte Cluster , und jeder Cluster wird als Knoten bezeichnet. MapReduce kann sowohl strukturierte als auch unstrukturierte Daten verarbeiten. Benutzer geben eine Zuordnungsfunktion an, die ein Schlüssel-Wert-Paar verarbeitet, um einen Satz von Zwischenpaaren zu generieren, und eine Reduzierungsfunktion, die diese Paare zusammenführt. Big Data-Datenbanken

Ein wichtiger Aspekt von Hadoop ist, dass es verschiedene Arten von Daten verarbeiten kann. Parallele Datenbankmanagementsysteme sind seit Jahrzehnten auf dem Markt. Sie können parallele Ausführung unterstützen, da die meisten Tabellen über die Knoten in einem Cluster partitioniert sind und SQL-Befehle in einen Plan übersetzt werden können, der auf die Knoten im Cluster verteilt ist. Sie befassen sich jedoch hauptsächlich mit strukturierten Daten, da es schwierig ist, unstrukturierte Freiformdaten in die Spalten und Zeilen in einem relationalen Modell einzupassen.

Hadoop hat eine Bewegung in dem begonnen, was als

NoSQL bezeichnet wurde, was nicht nur SQL bedeutet. Der Begriff bezieht sich auf eine Reihe von Technologien, die sich von relationalen Datenbanksystemen unterscheiden. Ein wesentlicher Unterschied ist, dass sie SQL nicht verwenden. Sie sind auch für verteilte Datenspeicher ausgelegt. NoSQL bedeutet nicht, dass Benutzer SQL nicht verwenden sollten. Vielmehr geht es darum, dass je nach Problemstellung relationale Datenbanken und NoSQL-Datenbanken in einer Organisation koexistieren können. Es gibt zahlreiche Beispiele für solche Arten von Datenbanken, darunter die folgenden:

Apache Cassandra:

  • Ein Open-Source-Datenverwaltungssystem, das ursprünglich von Facebook entwickelt wurde. Es hat keine strengen Strukturanforderungen und kann daher alle unterschiedlichen Datentypen verarbeiten. Experten behaupten, dass es sich bei der Massenverarbeitung von Echtzeittransaktionen auszeichnet. Andere Open-Source-Datenbanken sind MongoDB, Apache CouchDB und Apache HBase. Amazon Simple DB:

  • Amazon vergleicht diese Datenbank mit einer Tabelle, in der Spalten und Zeilen mit Attributen und Elementen gespeichert sind. Im Gegensatz zu einer Tabellenkalkulation kann jedoch jede Zelle mehrere Werte haben, und jedes Element kann einen eigenen Satz zugeordneter Attribute haben. Amazon indiziert dann automatisch die Daten. Vor kurzem kündigte Amazon Amazon Dynamo DB als eine Möglichkeit, Big Data NoSQL in die Cloud zu bringen. Google BigTable:

  • Dieser Hybrid ist so etwas wie ein großer Tisch. Da Tabellen sehr groß sein können, werden sie an den Zeilengrenzen in Tabellen aufgeteilt, die möglicherweise Hunderte von Megabytes umfassen. MapReduce wird häufig zum Generieren und Ändern von in BigTable gespeicherten Daten verwendet.

Verwaltung von Big Data-Technologien in einer Hybrid Cloud - Dummies

Die Wahl des Herausgebers

Was Sie über den Makler und die Hauptbeziehung für die Immobilienlizenzprüfung wissen sollten - Dummies

Was Sie über den Makler und die Hauptbeziehung für die Immobilienlizenzprüfung wissen sollten - Dummies

Die Elemente der Verantwortung eines Agenten gegenüber dem Auftraggeber werden in einem Wort zusammengefasst - Treuhänder. Die Immobilienlizenzprüfung wird zweifellos Fragen zu diesen Treuhandpflichten stellen. Treuhänder bedeutet treuer Diener, und ein Agent ist der Treuhänder des Auftraggebers. Der Vertreter vertritt getreu die Interessen des Auftraggebers vor allen anderen ...

Erkennen Miller Analogie Test 1: 3, 2: 4 Analogien - Dummies

Erkennen Miller Analogie Test 1: 3, 2: 4 Analogien - Dummies

The Der Miller Analogies Test (MAT) ist ein standardisierter Test, der normalerweise für die Zulassung von Absolventen verwendet wird. Der Test besteht vollständig aus Analogien. Der Miller Analogies Test verwendet mehrere Analogtypen wie 1: 3, 2: 4. Die Erkennung der Art der verwendeten Analogie spielt eine entscheidende Rolle bei der Auswahl der richtigen Antwort für diese Frage. ...

Erkennen Miller Analogie Test 1: 2, 3: 4 Analogien - Dummies

Erkennen Miller Analogie Test 1: 2, 3: 4 Analogien - Dummies

The Der Miller Analogies Test (MAT) ist ein standardisierter Test, der normalerweise für die Zulassung von Absolventen verwendet wird. Der Test besteht vollständig aus Analogien. Der Miller Analogies Test verwendet mehrere Analogtypen wie 1: 2, 3: 4. Die Erkennung der Art der verwendeten Analogie spielt eine entscheidende Rolle bei der Auswahl der richtigen Antwort für diese Frage. ...

Die Wahl des Herausgebers

Excel-Dashboards und -Berichte: So führen Sie Makros aus - Dummies

Excel-Dashboards und -Berichte: So führen Sie Makros aus - Dummies

Makros sind sehr nützlich für Ihre Excel Dashboards und Berichte. Um Ihre Makros in Aktion zu sehen, wählen Sie den Befehl Makros auf der Registerkarte Entwickler. Das in dieser Abbildung gezeigte Dialogfeld wird angezeigt, in dem Sie das Makro auswählen können, das Sie ausführen möchten. Wählen Sie das AddDataBars-Makro aus, und klicken Sie auf die Schaltfläche Ausführen. Wenn alles gut geht, ...

Excel-Dashboards und Berichte: Halten Sie Ihre Pivot-Tabelle frisch - Dummies

Excel-Dashboards und Berichte: Halten Sie Ihre Pivot-Tabelle frisch - Dummies

So langweilig wie Ihre Pivot-Tabellen Wie es scheint, werden sie schließlich zu den Stars Ihrer Excel-Berichte und Dashboards. Es ist daher wichtig, dass Sie Ihre Pivottabellen frisch und relevant halten. Im Laufe der Zeit können sich Ihre Daten mit neu hinzugefügten Zeilen und Spalten ändern und wachsen. Die Aktion der Aktualisierung Ihrer Pivot-Tabelle mit diesen ...

Excel 2010 Für Dummies Cheat Sheet - Dummies

Excel 2010 Für Dummies Cheat Sheet - Dummies

Auf den ersten Blick kann es schwierig sein, die vielen Menüs zu verstehen , Tabulatoren, Spalten und Zeilen der Excel 2010-Benutzeroberfläche. Dieser Cheat Sheet hilft Ihnen jedoch, Ihren Weg zu navigieren, indem Sie Tastenanschläge für die Bewegung des Zellen-Cursors zu einer neuen Zelle zeigen, einfache Regeln für die Dateneingabe-Etikette, häufige Ursachen einiger ...

Die Wahl des Herausgebers

Verwendung von Web Stats zur Verbesserung Ihrer Website - Dummies

Verwendung von Web Stats zur Verbesserung Ihrer Website - Dummies

Leute mögen nicht langsame Webseiten. Die Verwendung von Webstatistiken kann sicherstellen, dass Sie keine haben. Heutzutage werden wir alle durch schnelle Internetverbindungen verwöhnt, und Forschungsergebnisse zeigen, dass Webnutzer auf eine andere Website klicken, wenn Ihre Website mehr als zwei Sekunden benötigt, um sie zu öffnen. Eine schnellere Site behält mehr Besucher. mit einem langsameren ...

Webhost-Systemsteuerungsoptionen - dummies

Webhost-Systemsteuerungsoptionen - dummies

Sie haben mehrere Optionen für Web gehostete Control Panels. Die beliebteste und offensichtlichste Wahl ist cPanel. cPanel ist aufgrund seiner Balance zwischen Flexibilität und Benutzerfreundlichkeit eine gute Wahl für Bedienfelder. Die Wahl des Bedienfelds ist jedoch eine Frage der persönlichen Vorlieben und Sie müssen eines finden, das am besten passt ...

Zehn Essential Online Web Hosting Ressourcen - Dummies

Zehn Essential Online Web Hosting Ressourcen - Dummies

Bücher sind großartige Referenzen, aber es gibt auch einige wirklich gute Web-Hosting-Ressourcen online verfügbar, um Ihnen zusätzliche Informationen zu geben, wenn Sie nicht finden können, was Sie brauchen. Haben Sie keine Angst, das Internet zu überprüfen. ZeltBlogger. com TentBlogger. com ist im Besitz und geschrieben von John Saddington. Es ist wahrscheinlich die beste Online-Ressource für praktisch alles mit ...