Inhaltsverzeichnis:
- Big-Data-Server-Virtualisierung
- Big-Data-Anwendungsvirtualisierung
- Big-Data-Netzwerkvirtualisierung
- Big-Data-Prozessor und Speichervirtualisierung
- Big-Data- und Speichervirtualisierung
Video: Big Data in der Gebäudetechnik 2024
Um große Datenmengen zu bewältigen, müssen große Mengen hochverteilter Datenspeicher verwaltet werden. und datenintensive Anwendungen. Virtualisierung bietet den zusätzlichen Grad an Effizienz, um Big Data-Plattformen Realität werden zu lassen. Obwohl Virtualisierung technisch gesehen keine Voraussetzung für Big Data-Analysen ist, sind Software-Frameworks in einer virtualisierten Umgebung effizienter.
Virtualisierung hat drei Merkmale, die die Skalierbarkeit und die Betriebseffizienz unterstützen, die für Big-Data-Umgebungen erforderlich sind:
-
Partitionierung: Bei der Virtualisierung werden viele Anwendungen und Betriebssysteme in einem einzigen physischen System unterstützt. Partitionierung der verfügbaren Ressourcen.
-
Isolierung: Jede virtuelle Maschine ist von ihrem physischen Hostsystem und anderen virtualisierten Maschinen isoliert. Aufgrund dieser Isolation sind die anderen virtuellen Maschinen und das Hostsystem nicht betroffen, wenn eine virtuelle Instanz abstürzt. Darüber hinaus werden Daten nicht zwischen einer virtuellen Instanz und einer anderen Instanz gemeinsam genutzt.
-
Encapsulation: Eine virtuelle Maschine kann als eine einzelne Datei dargestellt werden, sodass Sie sie anhand der bereitgestellten Dienste leicht identifizieren können.
Big-Data-Server-Virtualisierung
Bei der Servervirtualisierung ist ein physischer Server in mehrere virtuelle Server unterteilt. Die Hardware und Ressourcen einer Maschine - einschließlich des Arbeitsspeichers (RAM), der CPU, der Festplatte und des Netzwerkcontrollers - können zu einer Reihe von virtuellen Maschinen virtualisiert werden, die jeweils ihre eigenen Anwendungen und ihr eigenes Betriebssystem ausführen.
Eine virtuelle Maschine (VM) ist eine Softwaredarstellung einer physischen Maschine, die die gleichen Funktionen wie die physische Maschine ausführen oder ausführen kann. Eine dünne Softwareschicht wird tatsächlich in die Hardware eingefügt, die einen Monitor für virtuelle Maschinen oder Hypervisor enthält.
Servervirtualisierung verwendet den Hypervisor, um die Verwendung physischer Ressourcen effizienter zu gestalten. Natürlich sind Installations-, Konfigurations- und Verwaltungsaufgaben mit dem Einrichten dieser virtuellen Maschinen verbunden.
Servervirtualisierung hilft sicherzustellen, dass Ihre Plattform nach Bedarf skaliert werden kann, um die großen Volumina und unterschiedlichen Datentypen zu bewältigen, die in Ihrer Big Data-Analyse enthalten sind. Möglicherweise kennen Sie den Umfang des benötigten Volumens nicht, bevor Sie mit der Analyse beginnen. Diese Unsicherheit macht den Bedarf an Server-Virtualisierung noch größer und bietet Ihrer Umgebung die Möglichkeit, die unerwartete Nachfrage nach der Verarbeitung sehr großer Datenmengen zu erfüllen.
Darüber hinaus bietet die Servervirtualisierung die Grundlage für viele Cloud-Services, die als Datenquellen in einer Big Data-Analyse verwendet werden. Virtualisierung erhöht die Effizienz der Cloud, wodurch die Optimierung komplexer Systeme erleichtert wird.
Big-Data-Anwendungsvirtualisierung
Die Virtualisierung von Anwendungsinfrastrukturen bietet eine effiziente Möglichkeit zur Verwaltung von Anwendungen im Kontext der Kundennachfrage. Die Anwendung ist so gekapselt, dass ihre Abhängigkeiten vom zugrunde liegenden physischen Computersystem entfernt werden. Dies trägt dazu bei, die allgemeine Verwaltbarkeit und Portabilität der Anwendung zu verbessern.
Darüber hinaus ermöglicht die Anwendungsinfrastrukturvirtualisierungssoftware in der Regel die Codierung von geschäftlichen und technischen Nutzungsrichtlinien, um sicherzustellen, dass jede Ihrer Anwendungen virtuelle und physische Ressourcen auf vorhersagbare Weise nutzt. Effizienzgewinne werden erzielt, weil Sie IT-Ressourcen gemäß dem relativen Geschäftswert Ihrer Anwendungen leichter verteilen können.
Anwendungsinfrastrukturvirtualisierung, die in Kombination mit Servervirtualisierung verwendet wird, kann dazu beitragen, sicherzustellen, dass Business-Service-Level-Agreements erfüllt werden. Die Servervirtualisierung überwacht die CPU- und Arbeitsspeichernutzung, berücksichtigt jedoch keine Schwankungen der Geschäftspriorität bei der Zuweisung von Ressourcen.
Big-Data-Netzwerkvirtualisierung
Netzwerkvirtualisierung bietet eine effiziente Möglichkeit, Netzwerke als Pool von Verbindungsressourcen zu nutzen. Anstatt sich für die Verwaltung des Datenverkehrs auf das physische Netzwerk zu verlassen, können Sie mehrere virtuelle Netzwerke erstellen, die alle die gleiche physische Implementierung verwenden. Dies kann nützlich sein, wenn Sie ein Netzwerk für die Datenerfassung mit bestimmten Leistungsmerkmalen und Kapazitäten und ein anderes Netzwerk für Anwendungen mit unterschiedlicher Leistung und Kapazität definieren müssen.
Die Virtualisierung des Netzwerks trägt dazu bei, Engpässe zu verringern und die Verwaltung großer verteilter Daten zu verbessern, die für Big Data-Analysen erforderlich sind.
Big-Data-Prozessor und Speichervirtualisierung
Die Prozessor-Virtualisierung hilft dabei, den Prozessor zu optimieren und die Leistung zu maximieren. Die Speicher-Virtualisierung entkoppelt den Speicher von den Servern.
Bei der Big Data-Analyse haben Sie möglicherweise wiederholte Abfragen großer Datenmengen und die Erstellung fortschrittlicher Analysealgorithmen durchgeführt, die alle nach Mustern und Trends suchen, die noch nicht verstanden wurden. Diese erweiterten Analysen können viel Verarbeitungsleistung (CPU) und Arbeitsspeicher (RAM) erfordern. Für einige dieser Berechnungen kann es ohne ausreichende CPU- und Speicherressourcen lange dauern.
Big-Data- und Speichervirtualisierung
Mithilfe der Datenvirtualisierung kann eine Plattform für dynamisch verknüpfte Datendienste erstellt werden. Dadurch können Daten einfach durchsucht und über eine einheitliche Referenzquelle verknüpft werden. Infolgedessen stellt die Datenvirtualisierung einen abstrakten Dienst bereit, der Daten in einer konsistenten Form liefert, unabhängig von der zugrunde liegenden physischen Datenbank. Darüber hinaus stellt die Datenvirtualisierung zwischengespeicherte Daten für alle Anwendungen bereit, um die Leistung zu verbessern.
Die Speichervirtualisierung kombiniert physische Speicherressourcen, sodass sie effektiver gemeinsam genutzt werden können. Dies reduziert die Speicherkosten und erleichtert die Verwaltung von Datenspeichern, die für Big Data-Analysen erforderlich sind.