Video: Grundbegriffe bei relationalen Datenbanken 2024
NoSQL kann sich etwas schwer tun. Wenn Sie in der Schule Datenbanken studiert haben, wurden Sie vielleicht in einer relationalen Denkweise indoktriniert. Sagen Sie den meisten Leuten Datenbank , und sie denken relationales Datenbankverwaltungssystem . Das ist natürlich, weil das RDBMS in den letzten 30 Jahren so dominant war.
Um Ihnen auf dieser Reise behilflich zu sein, finden Sie hier einige Schlüsselbegriffe, die bei der Anwendung auf NoSQL-Datenbanken häufig vorkommen.
-
Datenbankaufbau
-
Datenbank: Eine einzelne logische Einheit, potenziell auf mehrere Maschinen verteilt, in die Daten eingefügt werden können und die für die darin enthaltenen Daten abgefragt werden können.
Der relationale Term Tablespace kann auch auf eine NoSQL-Datenbank oder -sammlung angewendet werden.
-
Datenfarm: Ein Begriff aus RDBMS, der sich auf einen Satz von schreibgeschützten Replikatsätzen bezieht, die in einem verwalteten Maschinencluster gespeichert sind.
In einem RDBMS können diese Maschinen normalerweise nicht ohne Ausfallzeit hinzugefügt werden. In NoSQL-Clustern ist eine schnelle Skalierung wünschenswert.
-
Partition: Ein Satz von Daten, die zusammen auf einem einzelnen Knoten gespeichert werden sollen, um die Verarbeitungseffizienz zu verbessern oder um repliziert zu werden.
Kann auch zum Abfragen verwendet werden. In diesem Fall kann es als Sammlung betrachtet werden.
-
-
Datenbankstruktur
-
Sammlung: Ein Satz von Datensätzen, normalerweise Dokumente, die zusammen gruppiert sind. Dies basiert nicht auf einer Eigenschaft innerhalb des Datensatzes, sondern auf dessen Metadaten. Das Zuweisen eines Datensatzes zu einer Sammlung erfolgt normalerweise zum Erstellungs- oder Aktualisierungszeitpunkt.
-
Schema: In RDBMS und bis zu einem gewissen Grad in Spaltenspeichern. Die Struktur der Daten muss in der Datenbank konfiguriert werden, bevor irgendwelche Daten geladen werden.
In Dokumentdatenbanken ist es zwar besser, eine Struktur zu speichern, doch ist es manchmal besser, die Strukturen zu beschränken, indem ein Schema erzwungen wird, wie z. B. in einer XML-Schemadefinition. NoSQL wird jedoch im Allgemeinen als schemafrei oder als unterstützendes Variablenschema betrachtet.
-
-
Datensätze
-
Datensatz: Eine einzelne atomare Einheit der Datendarstellung in der bestimmten Datenbank, die beschrieben wird.
In einem RDBMS wäre dies eine Zeile, wie es in Spaltenspeichern der Fall ist. Dies könnte auch ein Wert in einem Schlüsselwertspeicher, ein Dokument in einem Dokumentenspeicher oder ein Subjekt (nicht dreifach) in einem Dreifachspeicher sein.
-
Row: Atomare Datensatzeinheit in einem RDBMS- oder Spaltenspeicher.
Kann als Element in einem Dokumentenspeicher oder als Map in einem Schlüsselwertspeicher modelliert werden.
-
Feld: Ein einzelnes Feld innerhalb eines Datensatzes. Eine Spalte in einem RDBMS
Kann nicht in allen Datensätzen vorhanden sein, sollte jedoch vorhanden sein, sollte derselbe Typ oder dieselbe Struktur sein.
-
Tabelle: Eine einzelne Datensatzklasse. In Bigtable werden sie auch als Tabellen bezeichnet. In einem Triple-Store können sie abhängig vom Kontext als Subjekt-RDF-Typen oder als Graphen bezeichnet werden. In einem Dokumentenspeicher können es Sammlungen sein.
-
-
Datensatzzuordnungen
-
Primärschlüssel: Ein garantierter eindeutiger Wert in einer bestimmten Tabelle, mit dem immer auf einen Datensatz verwiesen werden kann. Ein Schlüssel in einem Schlüsselwertspeicher, ein URI in einem Dokumentenspeicher oder ein IRI in einem Dreifach- oder Diagrammspeicher.
-
Fremdschlüssel: Ein Datenwert, der einen Datensatz angibt, bezieht sich auf einen Datensatz in einer anderen Tabelle oder einem Datensatz. Hat den gleichen Wert wie der Primärschlüssel in der zugehörigen Tabelle.
-
Beziehung: Eine Verknüpfung oder Kante in der Graphentheorie, die anzeigt, dass zwei Datensätze eine semantische Verbindung haben. Die Beziehung kann zwischen zwei Datensätzen in derselben oder in verschiedenen Tabellen bestehen.
In RDBMS sind es normalerweise andere Tabellen, wohingegen es in einem Dreifachladen üblich ist, Themen des gleichen Typs (Personen in einem sozialen Graphen zum Beispiel) miteinander zu verknüpfen. Einige Datenbanken, hauptsächlich Graph-Speicher, unterstützen das Hinzufügen von Metadaten zu den Beziehungen.
-
-
Speicherorganisation
-
Server: Ein einzelner Computerknoten innerhalb eines Clusters. Führt normalerweise eine einzelne Instanz des Codes eines Datenbankservers aus.
-
Cluster: Eine physische Gruppierung oder Server, die zusammen im selben Rechenzentrum verwaltet werden, um einen einzelnen Dienst bereitzustellen. Kann seine Datenbanken in Clustern in anderen Rechenzentren replizieren.
-
Normale Form: Eine Methode zur Normalisierung oder Minimierung der Duplizierung in Daten in einem RDBMS.
NoSQL-Datenbanken führen normalerweise zu einer denormalisierten Datenstruktur, um schnellere Abfragen oder Datenzugriffe zu ermöglichen.
-
-
Replikationstechnologie
-
Plattenreplikation: Transparente Replikation von Daten zwischen Knoten in einem einzelnen Cluster, um im Falle eines Ausfalls eines einzelnen Knotens eine Hochverfügbarkeitsresilienz bereitzustellen.
-
Datenbankreplikation: Replikation zwischen Datenbanken in verschiedenen Clustern. Repliziert alle Daten in der Aktualisierungsreihenfolge von einem Cluster in einen anderen. Immer unidirektional.
-
Flexible Replikation: Bietet eine anwendungsgesteuerte Replikation von Daten zwischen Datenbanken in verschiedenen Clustern. Updates werden möglicherweise nicht in derselben Reihenfolge ange- meldet, in der sie auf die erste Datenbank angewendet wurden. In der Regel handelt es sich um eine benutzerdefinierte Verarbeitung, z. B. die Priorisierung von Datenaktualisierungen, die als nächstes gesendet werden sollen. Kann bidirektional mit geeignetem Update-Konfliktlösungscode sein.
-
-
Suchwerkzeuge
-
Index: Eine geordnete Liste von Werten, die in einem bestimmten Datensatz vorhanden sind.
-
Umgekehrter Index: Eine geordnete Liste von Werten (Begriffen) und eine Liste von Primärschlüsseln von Datensätzen, die diese Begriffe verwenden.
Bietet eine effiziente unstrukturierte Textsuche und schnelle Aggregationsfunktionen sowie Sortierung beim Zwischenspeichern im Arbeitsspeicher.
-
Abfrage: Eine Gruppe von Kriterien, die zu einer Liste von Datensätzen führt, die genau der Abfrage entsprechen und in der Reihenfolge bestimmter Feldwerte zurückgegeben werden.
-
Suche: Ein Satz von Kriterien, der zu einer Relevanz-geordneten Liste führt, die der Abfrage entspricht.
Die Suchkriterien erfordern möglicherweise keine genaue Übereinstimmung, sondern geben eine Relevanzberechnung zurück, die durch die Übereinstimmung der Übereinstimmung mit den Kriterien gewichtet ist.Das ist es, was Google macht, wenn Sie eine Suche durchführen.
-