Video: What is a data warehouse appliance? 2024
Wie bei bell-bottom-Jeans sind auch hardware-unterstützte Datenbanken auf dem Comeback. Microsoft, Oracle und Netezza sind bei Datenbank-Seminaren auf der ganzen Welt beliebt. In der Mitte bis Ende der 1980er Jahre waren die Verkäufer Britton Lee und Teradata (die schließlich fusionierten) der letzte Schrei.
Sie stellten dedizierte Maschinen zur Verfügung, die die Datenbankverarbeitung optimieren - die ersten Maschinen, die von großen Datenkonsumenten verwendet werden, darunter viele der Konsumgüterunternehmen.
Ziel dieser Boxen war es, alle Aspekte eines Computers zu nutzen, um Daten schneller an die Benutzer zu bringen. Diese dedizierte Maschine enthielt eine abfragezentrierte Datenbank, Arbeitsspeicher, CPU und Plattenoperationen. Irgendwann gerieten solche Produkte aus der Mode, und die Datenbankverwaltungssysteme wurden in eine offenere Architektur migriert, die lauffähig war.
Jetzt sind sie zurück!
Eine Data Warehouse-Appliance ist ein integrierter Satz von Servern, Speicher, Betriebssystemen, DBMS und Software, die speziell für Data Warehousing vorinstalliert und voroptimiert sind. Data Warehouse Appliances bieten Lösungen für den mittleren bis großen Data Warehouse-Markt und bieten eine kostengünstige Leistung bei Datenmengen im Terabyte-bis-Petabyte-Bereich (das sind viele Daten!).
Die meisten Hersteller von Data-Warehouse-Appliances verwenden MPP-Architekturen (Massively Parallel Processing), um eine hohe Abfrageleistung und Plattformskalierbarkeit zu bieten. MPP-Architekturen bestehen aus unabhängigen Prozessoren oder Servern, die parallel ausgeführt werden.
Die meisten MPP-Architekturen implementieren eine Shared-Nothing-Architektur, , bei der jeder Server autark ist und seinen eigenen Speicher und seine Festplatte steuert. Freigegebene Nichtsarchitekturen haben einen nachgewiesenen Rekord für hohe Skalierbarkeit und geringe Konflikte.
Die meisten Data Warehouse-Appliances verteilen Daten auf dedizierte Plattenspeichereinheiten, die mit jedem Server in der Appliance verbunden sind. Mit dieser Verteilung können die Appliances eine relationale Abfrage auflösen, indem sie Daten auf jedem Server parallel scannen. Der Divide-and-Conquer-Ansatz bietet eine hohe Leistung und skaliert linear, wenn Sie neue Server in die Architektur aufnehmen.
Aus der Perspektive des Preises versuchen die meisten Anbieter in dieser Arena eine Plug-and-Play-Strategie. Zum Beispiel verkauft Netezza in der Regel einen neuen Benutzer sein Produkt als Plug-kompatibel mit Teradata für weniger als die Teradata-Wartungskosten. Dieser Preis macht die Produkte sehr attraktiv, was zu einer steigenden Akzeptanz führt.