Zuhause Persönliche Finanzen Graphverarbeitung In Hadoop - Dummies

Graphverarbeitung In Hadoop - Dummies

Inhaltsverzeichnis:

Video: hadoop yarn architecture 2025

Video: hadoop yarn architecture 2025
Anonim

Eine der aufregendsten aufkommenden NoSQL-Technologien betrifft das Speichern und Verarbeiten von Diagrammdaten. Man könnte denken, dass diese Aussage eine alte Nachricht ist, weil Informatiker seit Jahrzehnten Graphanalyse-Techniken entwickeln. Was Sie sagen, mag wahr sein, aber was neu ist, ist, dass Sie mit Hadoop Graphenanalysen in großem Maßstab durchführen können.

Was sind Grafikdaten?

Ein Graph in Datenbegriffen ist einfach eine Darstellung einzelner Entitäten und ihrer Beziehungen. Die Entitäten eines Graphen sind als Knoten (oder Knoten ) bekannt, und die Beziehungen zwischen Entitäten in einem Graphen sind als Kanten (oder Verbindungen) bekannt. >). Die Darstellung von Datensätzen in einem Diagramm im Gegensatz zu herkömmlichen Zeilen und Spalten vereinfacht die Verarbeitung Ihrer Daten auf eine Weise, die die Beziehungen zwischen Objekten kristallklar macht. Typische Diagrammberechnungen werden durch die kürzeste Wegstrecke zwischen mehreren Knoten in Ihrem Graphen dargestellt oder einfach dadurch, wie viele Knoten Verbindungen eines bestimmten Typs mit einem bestimmten Knoten haben.

Anwendungen für die Graphanalyse

Die bekannteste Anwendung für Graphdatenbanken ist der PageRank-Algorithmus von Google, der die Verknüpfungsbeziehungen zwischen allen bekannten Webseiten berechnet. Google stellt das Web als ein riesiges Diagramm dar, bei dem die Webseiten Knoten sind und die Links von einer Seite zu einer anderen als Kanten dargestellt werden. (Google teilte den Reichtum mit, indem er ein Papier veröffentlichte, das sein Graph-Analyse-Projekt - Pregel genannt - im Jahr 2010 beschrieb.) Die Graph-Verarbeitung, an der Google interessiert war, beinhaltete die Berechnung der Anzahl von eingehenden Verbindungen für jede Webseite.

Facebook sorgte 2013 für Aufsehen, als es ankündigte, dass es Apache Giraph (basierend auf dem Pregel-Artikel) verwendete, eine Grafikverarbeitungs-Engine, die entwickelt wurde, um in HDFS gespeicherte Graphen zu verarbeiten. Es zeigte die Macht von Giraph, indem es einen Graphen zeigte, der alle Benutzer von Facebook (über 1 Milliarde) und ihre Freundschaften (Milliarden!) Darstellt, die zusammen über 1 Billionen Kanten hat. Diese Skala ist atemberaubend: Wenn Sie Facebook sind und Berechnungen wie Freundschaftsempfehlungen durchführen müssen, welches Werkzeug ist dann besser als ein Grafikprozessor? Es ist keine Überraschung, dass eine verteilte Graphdatenbank im Kern jeder anderen bemerkenswerten Social-Media-Site liegt, einschließlich Twitter, LinkedIn, OkCupid und Pinterest.

Eine Grafikverarbeitungs-Engine kann problemlos viele praktische Fragen für Social-Media-Seiten beantworten. Zwei Beispiele zeigen, wie LinkedIn den Grad der Trennung zwischen Ihnen und einem anderen Benutzer darstellt. Dies ist eine kürzeste Pfadberechnung (was ist die engste Verbindung zwischen zwei Knoten?) und wie OkCupid Benutzern mit gemeinsamen Interessen zeigt, ist eine Reihe von kollaborativen Filterberechnungen (welche sind die häufigsten Verbindungen zu einem bestimmten Satz von Knoten?).

Graphanalyse in Hadoop

Die Graphanalyse zu Hadoop befindet sich im Frühjahr 2014 noch in einem frühen Stadium. Mit dem Aufkommen von YARN in Hadoop 2 werden Graphanalyse und andere spezialisierte Verarbeitungstechniken bei Hadoop immer beliebter. Viele der in diesem Artikel erwähnten sozialen Websites verwenden ihre eigenen, proprietären Diagrammdatenbanken und Verarbeitungsmodule, aber Facebook ist ein prominenter Benutzer von Giraph. Aufgrund des (impliziten) Gütesiegels von Facebook ist Giraph eine beliebte Wahl für die Analyse von Graphen auf Hadoop geworden, hat jedoch einige Einschränkungen. Es handelt sich lediglich um eine Verarbeitungsengine, da es Daten als Diagramm in den Speicher des Clusters lädt und für chargenorientierte Abfragen optimiert ist.

Eine weitere Grafikverarbeitungslösung stammt von Aurelius, einem Unternehmen, das eine Reihe von Open-Source-Analysewerkzeugen für Hadoop veröffentlicht hat. Das Kernstück des Angebots ist Titan, eine Graphendatenbank mit HBase als Persistenzschicht, die für interaktive Abfragen optimiert ist, und Faunus, eine Grafikverarbeitungsengine, die einen Schnappschuss eines Graphen von Titan in HDFS speichert und MapReduce-Jobs dagegen ausführt… Aurelius verfügt sowohl für die interaktive (Titan) als auch die Batch-Anwendung (Faunus) über die übliche Graph-Traversal-API namens Gremlin.

Schließlich verfügt das Apache Spark-Projekt über den GraphX-Ableger, der die Generierung von Diagrammdaten und die anschließende Verarbeitung innerhalb des Spark-Frameworks ermöglicht.

Graphverarbeitung In Hadoop - Dummies

Die Wahl des Herausgebers

Photoshop 7 Navigationswerkzeuge - dummies

Photoshop 7 Navigationswerkzeuge - dummies

Photoshop 7 bietet alle Möglichkeiten, durch die Funktionen zu navigieren, egal ob Sie eine Mac oder ein Windows-System. In der folgenden Tabelle finden Sie Informationen zum Scrollen, Zoomen und Durchlaufen von Photoshop 7: Action Windows Mac Scrollen Sie mit der Leertaste + ziehen Sie die Leertaste + Strg + Leertaste + klicken Sie auf Apple Command + Leertaste + klicken Sie auf Vergrößern und ändern ...

Photoshop 7 Mal- und bearbeitungswerkzeuge - dummies

Photoshop 7 Mal- und bearbeitungswerkzeuge - dummies

In Photoshop 7 sind die Tastenkombinationen für Mal- und Bearbeitungswerkzeuge meist das Gleiche, ob Sie ein Windows-basiertes System oder einen Mac verwenden. Der einzige Unterschied besteht im letzten Eintrag in der folgenden Tabelle, in der die Verknüpfungen angezeigt werden: Erhöhen der Pinselgröße] Verringern der Pinselgröße [Ändern der Deckkraft oder des Werkzeugflusses 1, ...

Photoshop 7 Paletten-Werkzeuge - Dummies

Photoshop 7 Paletten-Werkzeuge - Dummies

Die Paletten von Photoshop 7 geben Ihnen Zugriff auf Gruppen verwandter Werkzeuge. Wenn Sie sich also auf Farbe konzentrieren, können Sie die Farbpalette aufziehen und Ihre Photoshop-Bilder mit einem Regenbogen von Schattierungen beleben. Die folgende Tabelle zeigt den Zugriff auf die verschiedenen Photoshop 7-Paletten in Windows- und Mac-Systemen: Palette / Aktion ...

Die Wahl des Herausgebers

Fantasy Fußball für Dummies Cheat Sheet - Dummies

Fantasy Fußball für Dummies Cheat Sheet - Dummies

Fantasy Fußball ist ein Spaß, wettbewerbsfähig und süchtig machendes Hobby. Bringen Sie Ihre Fantasy-Saison in Schwung, indem Sie Spieler entwerfen, um ein solides Team aufzubauen und Coaching-Tipps verwenden, um Ihr Team stark zu machen. Wenn Sie eine Position verbessern müssen, probieren Sie einige Strategien für den Handel mit Spielern und den Erwerb freier Agenten aus. Halten Sie einen Führer handlich von ...

Wie Fantasy-Fußball-Playoffs funktionieren - Dummies

Wie Fantasy-Fußball-Playoffs funktionieren - Dummies

Wenn du das Ende deiner Fantasy-Football-Saison erreichst, wenn sie vorbei ist Nun, Sie sind vielleicht im Streit, um die Playoffs zu machen. Wenn das der Fall ist, herzlichen Glückwunsch! Mit diesen Rechten geht es um dieses Spiel, und Sie sind dem ultimativen Preis einen Schritt näher. Wenn nicht, fühle dich nicht schlecht. ...

Bereiten Sie Ihre Fantasy Football Roster für die Draft - Dummies

Bereiten Sie Ihre Fantasy Football Roster für die Draft - Dummies

Vor, wenn Sie Ihre Fantasy Football League erforschen und herausfinden Wie viele Dienstplan-Spots Sie haben, können Sie Ihre Aufmerksamkeit darauf lenken, Ihren Entwurf basierend auf diesen Anforderungen vorzubereiten. Sie können Ihren eigenen Dienstplan-Spickzettel aus CheatSheet War Room ausdrucken. Neben dem Listenblatt finden Sie weitere kostenlose druckbare Fantasy-Fußball ...

Die Wahl des Herausgebers

Erstellen eines neuen Dokuments aus CSS-Starterseiten in Dreamweaver CS6 - Dummies

Erstellen eines neuen Dokuments aus CSS-Starterseiten in Dreamweaver CS6 - Dummies

Adobe Dreamweaver CS6 bietet Ihnen eine Bibliothek von Beispielseiten mit CSS-basierten Layouts als Alternative zum Neuanfang. Diese CSS-Beispielseiten enthalten nützliche und allgemeine Layoutideen, und da sie mit CSS-Positionierung erstellt werden, sind sie sehr flexibel. Sie können sie direkt im Bedienfeld "CSS-Stile" oder im Eigenschafteninspektor ändern. ...