Video: Florian Liß: Webcrawler 2024
Hier erfahren Sie, wie Sie Laden Sie HBase im Standalone-Modus herunter und installieren Sie sie. Es ist erstaunlich einfach, HBase zu installieren und die Technologie zu nutzen. Beachten Sie, dass HBase in der Regel auf einem Cluster von Commodity-Servern bereitgestellt wird. Sie können HBase jedoch auch einfach in einer eigenständigen Konfiguration zu Lern- oder Demonstrationszwecken bereitstellen.
Wie Apache Hadoop unterstützt auch HBase primär Linux, aber kann Windows in Nicht-Produktionsumgebungen verwenden, wenn Sie Cygwin zum ersten Mal herunterladen. Cygwin gibt Microsoft Windows-Benutzern eine Unix-Shell mit all ihren Befehlen und Dienstprogrammen. Wenn Sie die Kurzanleitung befolgen, sollten Sie die neueste HBase-Version herunterladen.
Sie können wählen, wo HBase installiert werden soll. Es stellt sich jedoch heraus, dass, wenn Sie Dinge im Standalone-Modus ausführen möchten, Sie ein paar Dateien bearbeiten müssen, bevor Sie HBase tatsächlich starten können. Die erste Datei wird in der folgenden Liste angezeigt. Die Änderungen, die Sie vornehmen möchten, sind fett dargestellt, um sie hervorzuheben:
hbase. rootdir datei: /// home / biadmin / meine-lokale-hbase / hbase-daten hbase. Cluster. verteilt wahr hbase. Tierpfleger. Eigentum. clientPort 2222 Eigenschaft aus ZooKeeper's config zoo. cfg. Der Port, an dem die Clients eine Verbindung herstellen. hbase. Tierpfleger. Eigentum. dataDir / home / biadmin / mein-lokaler-hbase / zookeeper hbase. Tierpfleger. Quorum bivm
Sie geben ein Verzeichnis im lokalen Dateisystem an, in dem die HBase-Daten gespeichert werden sollen. In Produktionsumgebungen verweist diese Eigenschaft auf das HDFS für den Datenspeicher. Zur Veranschaulichung veranlasst der pseudoverteilte Modus HBase, eine RegionServer-Instanz, eine MasterServer-Instanz und einen Zookeeper-Prozess zu starten.
Außerdem müssen Sie das Verzeichnis angeben, in dem Zookeeper seine Daten () und eine Liste von Servern speichert, auf denen Zookeeper ausgeführt wird, um ein Quorum () zu bilden. Für Standalone geben Sie nur den einzelnen Zookeeper-Server an.
Erste Schritte mit HBase im Standalone-Modus sind zum Teil sehr einfach, da HBase Zookeeper für Sie verwaltet. Sie können eine separate Zookeeper-Version herunterladen und HBase darauf verweisen, aber für eigenständige Installationen ist es für Sie einfacher, HBase den Zookeeper für Sie verwalten zu lassen.
Um die Entscheidung zu kristallisieren, dass HBase Zookeeper für Sie verwaltet, können Sie eine Umgebungsvariable in einer weiteren HBase-Datei festlegen. Die folgende Auflistung zeigt, was hinzugefügt werden muss:
# Teilen Sie HBase mit, ob es seine eigene Instanz von Zookeeper verwalten soll oder nicht. export HBASE_MANAGES_ZK = true # Die zu verwendende Java-Implementierung.Java 1. 6 erforderlich. export JAVA_HOME = / opt / ibm / biginsights / jdk
Sie müssen sicherstellen, dass Sie auf Ihr ausgewähltes JDK zeigen. Schließlich müssen Sie den Namen Ihres Linux-Systems in einer weiteren Datei angeben. (In einer vollständig verteilten Produktionsumgebung würde diese Datei eine zeilenweise Liste aller Server enthalten, auf denen HBase den RegionServer-Prozess starten kann.)
Sie können HBase jetzt starten und Ihre Installation testen. Verwenden Sie zum Starten von HBase das in der folgenden Liste beschriebene Skript.
$ cd $ INSTALL_DIR / hbase-0. 94. 7 / bin $. / start-hbase. sh bivm: startender zookeeper, logging nach / home / biadmin / my-local-hbase / hbase-0. 94. 7 / bin / … / logs / hbase-biadmin-zookeeper-bivm. out start master, Protokollierung nach / home / biadmin / my-local-hbase / hbase-0. 94. 7 / bin / … / logs / hbase-biadmin-master-bivm. aus localhost: start regionserver, loggen nach / home / biadmin / my-local-hbase / hbase-0. 94. 7 / bin / … / logs / hbase-biadmin-regionserver-bivm. out
Beachten Sie, dass die erste Zeile einen Befehl cd (change directory) enthält, der Sie zu einer Umgebungsvariablen führt. Sie müssen diese Variable auf Ihr tatsächliches Installationsverzeichnis für HBase setzen oder den vollständigen Pfad eingeben.
Als Nächstes verwenden Sie das JConsole-Tool, das im Lieferumfang von Java enthalten ist, um schnell zu überprüfen, welche Prozesse nach Abschluss des Skripts ausgeführt werden. Sie können das JConsole-Tool starten, indem Sie den folgenden Befehl eingeben: $ JAVA_HOME / bin / jconsole.
JConsole zeigt, dass die drei Prozesse, die das Skript startete, tatsächlich ausgeführt werden - der Zookeeper, der Master und die RegionServer-Prozesse.
Um HBase auf Herz und Nieren zu testen, interagieren Sie mit allen drei HBase-Prozessen, beginnend mit dem MasterServer. Standardmäßig meldet der MasterServer den Systemstatus über eine Browser-Benutzeroberfläche unter der Portnummer 60010. Im Beispiel können Sie die korrekte Ausführung des MasterServers überprüfen, indem Sie die folgende URL in einen Webbrowser eingeben: // bivm: 60010 /. Dadurch werden die Informationen angezeigt, die Sie hier sehen.