Zuhause Persönliche Finanzen Ausführen von Anwendungen vor Hadoop 2 - Dummies

Ausführen von Anwendungen vor Hadoop 2 - Dummies

Video: How to Setup Multinode Hadoop 2 on CentOS/RHEL Using VirtualBox 2025

Video: How to Setup Multinode Hadoop 2 on CentOS/RHEL Using VirtualBox 2025
Anonim

Da in vielen vorhandenen Hadoop-Bereitstellungen noch kein weiterer Ressourcenverhandler (YARN) verwendet wird, werfen Sie einen Blick darauf, wie Hadoop seine Datenverarbeitung vor den Tagen verwaltet hat. of Hadoop 2. Konzentrieren Sie sich auf die Rolle, die JobTracker-Masterdämonen und TaskTracker-Slave-Daemons bei der Verarbeitung von MapReduce-Prozessen spielen.

Der Zweck der Verwendung verteilter Systeme besteht darin, in der Lage zu sein, Rechenressourcen in einem Netzwerk von in sich abgeschlossenen Computern auf eine Weise bereitzustellen, die fehlertolerant, einfach und kostengünstig ist.

In einem verteilten System wie Hadoop, in dem ein Cluster von in sich abgeschlossenen Rechenknoten parallel arbeitet, ist eine große Komplexität erforderlich, um sicherzustellen, dass alle Teile zusammenarbeiten. Als solche haben diese Systeme typischerweise unterschiedliche Schichten, um verschiedene Aufgaben zu bewältigen, um eine parallele Datenverarbeitung zu unterstützen.

Dieses Konzept, bekannt als die Trennung von Bedenken, stellt sicher, dass, wenn Sie zum Beispiel der Anwendungsprogrammierer sind, Sie sich nicht um die spezifischen Details kümmern müssen, z. B. das Failover von Kartentasks. In Hadoop besteht das System aus diesen vier verschiedenen Schichten, wie gezeigt:

  • Verteilter Speicher: Das Hadoop Distributed File System (HDFS) ist die Speicherschicht, auf der die Daten, Zwischenergebnisse und Endergebnissätze gespeichert werden.

  • Ressourcenverwaltung: Zusätzlich zum Speicherplatz verfügen alle Slave-Knoten im Hadoop-Cluster über CPU-Zyklen, RAM und Netzwerkbandbreite. Ein System wie Hadoop muss in der Lage sein, diese Ressourcen zu parzellieren, damit mehrere Anwendungen und Benutzer den Cluster auf vorhersagbare und abstimmbare Weise gemeinsam nutzen können. Dieser Job wird vom JobTracker-Dämon ausgeführt.

  • Verarbeitungsframework: Der MapReduce-Prozessablauf definiert die Ausführung aller Anwendungen in Hadoop 1. Dies beginnt mit der Kartenphase; fährt fort mit Aggregation mit Shuffle, Sortieren oder Merge; und endet mit der Reduktionsphase. In Hadoop 1 wird dies ebenfalls vom JobTracker-Daemon verwaltet, wobei die lokale Ausführung von TaskTracker-Dämonen verwaltet wird, die auf den Slave-Knoten ausgeführt werden.

  • Anwendungsprogrammierschnittstelle (API): Für Hadoop 1 entwickelte Anwendungen müssen mit der MapReduce-API codiert werden. In Hadoop 1 bieten die Hive- und Pig-Projekte Programmierern einfachere Schnittstellen zum Schreiben von Hadoop-Anwendungen, und unter der Haube kompiliert sich ihr Code zu MapReduce.

In der Welt von Hadoop 1 (die einzige Welt bis vor kurzem) drehte sich die gesamte Datenverarbeitung um MapReduce.

Ausführen von Anwendungen vor Hadoop 2 - Dummies

Die Wahl des Herausgebers

Wie man die Socialcast Mobile App benutzt - dummies

Wie man die Socialcast Mobile App benutzt - dummies

Sogar die stoischste Anwendung wie Microsoft Excel hat ein begleitendes Smartphone-App, natürlich hat Socialcast auch eine. Wenn es so wäre, wäre es nicht wirklich eine Ausrede zu sagen, dass Socialcast nicht sehr sozial wäre, wenn du es nicht mit in die große Welt außerhalb deiner Zelle mitnehmen könntest. Die mobile App ...

Wie man das App Verzeichnis von Yammer benutzt - dummies

Wie man das App Verzeichnis von Yammer benutzt - dummies

Sie haben vielleicht gehört: "Es gibt eine App dafür. "Nun, das ist der Fall bei Yammer, der als einzige Ressource für die Vernetzung am Arbeitsplatz funktioniert. Aber Yammer bietet Ihnen auch eine Menge Apps, mit denen Sie Ihr Arbeitsleben noch einfacher gestalten können. Es gibt zwei Möglichkeiten, auf das App-Verzeichnis zuzugreifen: Option ...

So ​​verwenden Sie die Yammer-Analysetools - Dummies

So ​​verwenden Sie die Yammer-Analysetools - Dummies

Yammer rühmt sich damit als "führendes soziales Unternehmensnetzwerk für Unternehmen" um die Arbeit intelligenter und schneller zu erledigen. "Woher weißt du, ob das wahr ist? Ein guter Weg, um zu sehen, wie es für Sie funktioniert, ist die Analyse von Yammer. Wie greifen Sie auf diese großartigen Tools zu? Es ist einfach. Log ...

Die Wahl des Herausgebers

Die Evolution von Distributed Computing für Big Data - Dummies

Die Evolution von Distributed Computing für Big Data - Dummies

Hinter allen wichtigen Trends des letzten Jahrzehnts, einschließlich Serviceorientierung, Cloud Computing, Virtualisierung und Big Data, ist eine grundlegende Technologie namens Distributed Computing. Einfach gesagt, ohne die Verteilung von Datenverarbeitung wäre keiner dieser Fortschritte möglich. Distributed Computing ist eine Technik, mit der einzelne Computer über geografische Gebiete hinweg miteinander vernetzt werden können, so als ob ...

Drei Anbieter mit Data Mining-Produkten - Dummies

Drei Anbieter mit Data Mining-Produkten - Dummies

Es gibt mehrere Anbieter, die Data-Mining-Produkte verkaufen, die Sie vielleicht in Betracht ziehen möchten. Verwenden Sie mit Ihrem Data Warehouse. Hier sind drei, die eine Überlegung wert sind. Microsoft Microsoft hat das serverseitige Data Mining mit Microsoft SQL Server 2005 eingeführt. Obwohl es nicht so ausgereift und ausgeklügelt wie SAS und SPSS ist, hat Microsoft im Laufe der Zeit seine Fähigkeit bewiesen ...

Grundlagen der Big-Data-Integration - Dummies

Grundlagen der Big-Data-Integration - Dummies

Die fundamentalen Elemente der Big-Data-Plattform verwalten Daten auf neue Weise verglichen mit der traditionellen relationalen Datenbank. Dies liegt daran, dass Skalierbarkeit und hohe Leistung erforderlich sind, um sowohl strukturierte als auch unstrukturierte Daten zu verwalten. Komponenten des Big-Data-Ökosystems von Hadoop bis NoSQL DB, MongoDB, Cassandra, ...

Die Wahl des Herausgebers

So ​​stellen Sie eine Verbindung zu Spotify Mobile her - Dummies

So ​​stellen Sie eine Verbindung zu Spotify Mobile her - Dummies

Die meisten modernen Smartphones sind Wi-Fi-fähig. In ein lokales Netzwerk können Sie Spotify-Tracks mithilfe von Wi-Fi auf Ihr Telefon streamen. Sie können Spotify Mobile zu Hause und über Wi-Fi-Netzwerke in Hotels und Cafés problemlos nutzen - Sie müssen nur sicherstellen, dass Sie angemeldet und verbunden sind. ...

Wie Spotify funktioniert - Dummies

Wie Spotify funktioniert - Dummies

Wie Spotify funktioniert, kann Auswirkungen auf den Festplattenspeicher Ihres Computers haben. Internetverbindung. Spotify funktioniert anders als viele andere Online-Musikdienste, weil es auf mehrere Arten angewiesen ist, um Ihnen reibungslos Musik ohne Verzögerungen zu liefern. In Computing-Sprechen, das Maß der Verzögerung zwischen Anfordern eines Songs und Hören es ...

So ​​erreichen Sie Spotify Support - Dummies

So ​​erreichen Sie Spotify Support - Dummies

Es kann vorkommen, dass Sie eine kleine Hilfe beim Navigieren und Verwenden von Spotify benötigen von deinen Spotify Freunden. Sie können jederzeit Support @ spotify per E-Mail senden. com mit Ihrer Frage oder melden Sie sich bei Twitter an und senden Sie einen Tweet an @spotify. Stellen Sie sicher, dass Sie alle Informationen einschließen, die dem Support-Team helfen könnten, einschließlich Ihres Benutzernamens, damit sie ...