Zuhause Persönliche Finanzen Dokument Datenbanken in einer Big Data Umgebung - Dummies

Dokument Datenbanken in einer Big Data Umgebung - Dummies

Inhaltsverzeichnis:

Video: #MASKID - Warum wir die Bundesdruckerei gehackt und jetzt einen Pass mit Mogherinis Gesicht haben. 2025

Video: #MASKID - Warum wir die Bundesdruckerei gehackt und jetzt einen Pass mit Mogherinis Gesicht haben. 2025
Anonim

Sie finden zwei Arten von Dokumentendatenbanken für Big Data-Projekte. Man wird oft als ein Repository für vollständigen Dokumentstil-Inhalt beschrieben. Die andere ist eine Datenbank zum Speichern von Dokumentenkomponenten für die permanente Speicherung als statische Entität oder zum dynamischen Zusammenfügen der Teile eines Dokuments. Die Struktur der Dokumente und ihrer Teile wird von JavaScript Object Notation (JSON) und / oder Binary JSON (BSON) bereitgestellt.

Dokumentendatenbanken sind am nützlichsten, wenn Sie viele Berichte erstellen müssen und dynamisch aus Elementen zusammengestellt werden müssen, die sich häufig ändern.

Im Kern ist JSON ein Datenaustauschformat, das auf einer Untermenge der JavaScript-Programmiersprache basiert. Obwohl es Teil einer Programmiersprache ist, ist es textlicher Natur und sehr leicht zu lesen und zu schreiben. Es hat auch den Vorteil, dass Computer leicht zu handhaben sind. In JSON gibt es zwei grundlegende Strukturen, die von vielen, wenn nicht sogar allen modernen Programmiersprachen unterstützt werden.

Die erste grundlegende Struktur ist eine Sammlung von Name / Wert-Paaren, die programmatisch als Objekte, Datensätze, Schlüssellisten usw. dargestellt werden. Die zweite grundlegende Struktur ist eine geordnete Liste von Werten, und sie werden programmatisch als Arrays, Listen oder Sequenzen dargestellt. BSON ist eine binäre Serialisierung von JSON-Strukturen, die die Leistung und Skalierbarkeit erhöhen sollen.

MongoDB für Big Data

MongoDB ist der Projektname für das System "hu (mongo) us database". Es wird von einer Firma namens 10gen als Open Source betrieben und ist unter der GNU AGPL v3 frei verfügbar. 0 Lizenz. Kommerzielle Lizenzen mit voller Unterstützung sind bei 10gen erhältlich.

MongoDB besteht aus Datenbanken mit "Sammlungen". "Eine Sammlung besteht aus" Dokumenten ", und jedes Dokument besteht aus Feldern. Genau wie in relationalen Datenbanken können Sie eine Sammlung indizieren.

Dadurch wird die Leistung der Datenabfrage erhöht. Im Gegensatz zu anderen Datenbanken gibt MongoDB jedoch einen so genannten "Cursor" zurück, der als Zeiger auf die Daten dient. Dies ist eine sehr nützliche Funktion, da sie die Möglichkeit bietet, die Daten zu zählen oder zu klassifizieren, ohne sie zu extrahieren. MongoDB unterstützt nativ BSON, die binäre Implementierung von JSON-Dokumenten.

MongoDB ist auch ein Ökosystem, das aus den folgenden Elementen besteht:

  • Hochverfügbarkeits- und Replikationsdienste für die Skalierung in lokalen und Weitverkehrsnetzen.

  • Ein rasterbasiertes Dateisystem, das die Speicherung großer Objekte durch Aufteilung in mehrere Dokumente ermöglicht.

  • MapReduce zur Unterstützung der Analyse und Aggregation verschiedener Sammlungen / Dokumente.

  • Ein Sharding-Dienst, der eine einzelne Datenbank über ein Cluster von Servern in einem einzelnen oder mehreren Datencentern verteilt. Der Dienst wird von einem Shard-Schlüssel gesteuert. Der Shard-Schlüssel wird verwendet, um Dokumente intelligent über mehrere Instanzen hinweg zu verteilen.

  • Ein Abfragedienst, der Ad-hoc-Abfragen, verteilte Abfragen und Volltextsuche unterstützt.

Zu ​​den effektiven MongoDB-Implementierungen gehören

  • Hochvolumiges Content-Management

  • Soziale Netzwerke

  • Archivieren

  • Echtzeit-Analysen

CouchDB für Big Data

Eine weitere sehr beliebte nicht relationale Datenbank ist CouchDB. Wie MongoDB ist CouchDB Open Source. Es wird von der Apache Software Foundation verwaltet und steht unter der Apache License v2 zur Verfügung. 0. Im Gegensatz zu MongoDB wurde CouchDB entwickelt, um das Web in jeder Hinsicht nachzuahmen.

Zum Beispiel ist CouchDB gegenüber Netzausfällen widerstandsfähig und wird auch in Bereichen, in denen die Netzwerkkonnektivität nur sporadisch ist, weiterhin gut funktionieren. Es ist auch auf einem Smartphone oder in einem Rechenzentrum zu Hause. Das alles kommt mit ein paar Kompromissen. Aufgrund der zugrundeliegenden Web-Mimikry hat CouchDB eine hohe Latenz, was zu einer Bevorzugung der lokalen Datenspeicherung führt.

CouchDB eignet sich nicht für kleinere Implementierungen. Sie müssen feststellen, ob diese Kompromisse ignoriert werden können, wenn Sie mit der Big Data-Implementierung beginnen.

CouchDB-Datenbanken bestehen aus Dokumenten, die aus Feldern und Anhängen bestehen, sowie einer "Beschreibung" des Dokuments in Form von Metadaten, die automatisch vom System gepflegt werden. Die zugrunde liegende Technologie verfügt über alle ACID-Funktionen. Der Vorteil in CouchDB gegenüber relationalen ist, dass die Daten gepackt und bereit für die Manipulation oder Speicherung sind, anstatt über Zeilen und Tabellen verteilt zu sein.

CouchDB ist auch ein Ökosystem mit den folgenden Fähigkeiten:

  • Kompaktierung: Die Datenbanken werden komprimiert, um unnötigen Speicherplatz zu vermeiden, wenn ein bestimmtes Maß an Leerheit erreicht wird. Dies hilft der Performance und der Effizienz bei der Persistenz.

  • Modell anzeigen: Ein Mechanismus zum Filtern, Organisieren und Berichten von Daten unter Verwendung einer Reihe von Definitionen, die als Dokumente in der Datenbank gespeichert werden. Sie finden eine One-to-many-Beziehung von Datenbanken zu Ansichten, so dass Sie viele verschiedene Möglichkeiten zur Darstellung der Daten erstellen können, die Sie "in Scheiben geschnitten und gewürfelt" haben. "

  • Replikation und verteilte Dienste: Der Dokumentenspeicher ist für bidirektionale Replikation vorgesehen. Teilrepliken können verwaltet werden, um eine kriterienbasierte Verteilung oder Migration zu Geräten mit eingeschränkter Konnektivität zu unterstützen. Die native Replikation ist Peer-basiert, Sie können jedoch Master / Slave, Master / Master und andere Replikationsmodalitäten implementieren.

Effektive CouchDB-Implementierungen sind:

  • Umfangreiche Inhaltsverwaltung

  • Skalierung vom Smartphone zum Rechenzentrum

  • Anwendungen mit eingeschränkter oder langsamer Netzwerkverbindung

Dokument Datenbanken in einer Big Data Umgebung - Dummies

Die Wahl des Herausgebers

Verknüpfungen für Common View-Befehle in Excel 2007 - Dummys

Verknüpfungen für Common View-Befehle in Excel 2007 - Dummys

, Wenn Sie die Art ändern möchten, wie Sie sind Wenn Sie ein Excel 2007-Arbeitsblatt oder die Art und Weise, wie die Seite ausgelegt ist, ansehen, verwenden Sie diese Tastenkombinationen für die Ansichtsbefehle (Alt + Abkürzungstaste). Hotkeys Excel Multifunktionsleiste Befehl Funktion Alt + WN Ansicht | Normale Ansicht Gibt das Arbeitsblatt aus dem Seitenlayout oder der Seitenumbruchvorschau in die normale Ansicht zurück ...

Mit Excel 2016-Arbeitsmappen gespeichert wurden, die auf Ihren OneDrive-Dummies

Mit Excel 2016-Arbeitsmappen gespeichert wurden, die auf Ihren OneDrive-Dummies

Gespeichert wurden OneDrive in der Cloud. Gehen Sie folgendermaßen vor, um Excel 2016-Arbeitsmappen von Ihrem OneDrive freizugeben: Öffnen Sie die Arbeitsmappendatei, die Sie in Excel 2016 freigeben möchten, und klicken Sie dann ganz rechts in der Zeile mit der Multifunktionsleiste auf die Schaltfläche Freigeben. Excel wird geöffnet ...

Verknüpfungen zum Verschieben des Zellencursors in Excel 2007 - dummies

Verknüpfungen zum Verschieben des Zellencursors in Excel 2007 - dummies

Microsoft Office Excel 2007 bietet eine Vielzahl von Tastaturkürzel zum Auswählen einer neuen Zelle. Wenn Sie eine dieser Tastenkombinationen verwenden, scrollt das Programm automatisch einen neuen Teil des Arbeitsblatts in die Ansicht, wenn dies zum Bewegen des Zellencursors erforderlich ist. Sie finden diese Tastenanschläge und ihre Aktionen in der folgenden Tabelle. Tastatureingaben ...

Die Wahl des Herausgebers

Netzwerkverwaltung: Windows Gruppenrichtliniengrundlagen - Dummies

Netzwerkverwaltung: Windows Gruppenrichtliniengrundlagen - Dummies

Gruppenrichtlinie bezieht sich auf eine Funktion von Windows-Betriebssystemen, die Sie steuern, wie bestimmte Aspekte von Windows und anderer Microsoft-Software in Ihrem Netzwerk funktionieren. Viele Funktionen, die Sie möglicherweise in einer Verwaltungskonsole finden, z. B. Active Directory-Benutzer und -Computer, werden stattdessen von Gruppenrichtlinien gesteuert. Gruppenrichtlinie besteht aus ...

Netzwerkverwaltung: Windows Server 2008 Anmeldeskripts - Dummys

Netzwerkverwaltung: Windows Server 2008 Anmeldeskripts - Dummys

Ein Anmeldeskript ist eine Stapeldatei, die automatisch ausgeführt wird wann immer sich ein Benutzer anmeldet. Der häufigste Grund für die Verwendung eines Anmeldeskripts besteht darin, die Netzwerkfreigaben zuzuordnen, auf die der Benutzer zugreifen muss. Hier ist ein einfaches Anmeldeskript, das drei Netzwerkfreigaben abbildet: echo off net use m: server1sharesadmin net ...

Netzwerkverwaltung: Windows Firewalls - Dummies

Netzwerkverwaltung: Windows Firewalls - Dummies

Windows enthält eine integrierte Firewall, die einen grundlegenden Paketfilterungs-Firewallschutz bietet. In den meisten Fällen sollten Sie einen dedizierten Firewall-Router verwenden, da diese Geräte bessere Sicherheitsfunktionen bieten als die integrierte Windows-Firewall. Dennoch ist die eingebaute Firewall für Heimnetzwerke oder sehr kleine Büronetzwerke geeignet. Hier sind die Schritte, die aktiviert werden ...

Die Wahl des Herausgebers

Wie sich einzelne kunden mit sozialen medien auseinandersetzen - dummies

Wie sich einzelne kunden mit sozialen medien auseinandersetzen - dummies

Im heutigen social-media-web haben menschen mehr macht als je. Verbraucher sind sich ihrer Macht zunehmend bewusst: Eine Person mit einem Blog kann Produkte überprüfen, das Bewusstsein für eine Marke schärfen und den Umsatz steigern. Jemand kann seine Meinung über eine Marke in seinen bevorzugten sozialen Netzwerken teilen und ihre Gedanken können sich exponentiell verbreiten. ...

Wie Online-Communities mit Social Media interagieren - dummies

Wie Online-Communities mit Social Media interagieren - dummies

Online-Community ist das Kollektiv, ein virtueller Ort und die Gruppen von Menschen, die das Social-Media-Engagement fördern. Ihre Social-Media-Engagements können nicht in einem Vakuum stattfinden. Die Aktivitäten des Engagements in sozialen Medien finden innerhalb von Online-Communities statt, sogar in Communities, die nur aus zwei Personen bestehen, wie z. B. Ihnen und jemand anderem. Social-Media-Plattformen und ...

Host beliebte Werbegeschenke auf Ihre Mutter Blog - Dummies

Host beliebte Werbegeschenke auf Ihre Mutter Blog - Dummies

Eine erfolgreiche Mutter Blogging-Website ist 5MinutesForMom. com. Die Zwillingsschwestern Janice Croze und Susan Carraretto schienen vom ersten Tag an mühelos Gemeinschaft und Verkehr aufzubauen. Einer der Wege, wie sie das taten, war, Giveaways auf ihrem Blog zu betreiben. Sie waren einer der allerersten Mutter Blogs, um diese Strategie als eine Möglichkeit zu verwenden ...