Zuhause Persönliche Finanzen Verteilte Rechengrundlagen für Big Data - Dummies

Verteilte Rechengrundlagen für Big Data - Dummies

Inhaltsverzeichnis:

Video: Grundlagen - Verteilte Systeme 2025

Video: Grundlagen - Verteilte Systeme 2025
Anonim

Wenn Ihr Unternehmen ein Big Data-Projekt in Betracht zieht, sollten Sie einige Grundlagen des verteilten Computers verstehen. zuerst. Es gibt kein einzelnes verteiltes Rechenmodell, da die Rechenressourcen auf viele Arten verteilt werden können.

Sie können beispielsweise eine Reihe von Programmen auf demselben physischen Server verteilen und Messaging-Dienste verwenden, um ihnen die Kommunikation und Weiterleitung von Informationen zu ermöglichen. Es ist auch möglich, viele verschiedene Systeme oder Server zu haben, jeder mit seinem eigenen Speicher, die zusammenarbeiten können, um ein Problem zu lösen.

Warum verteilte Datenverarbeitung für Big Data erforderlich ist

Nicht alle Probleme erfordern verteiltes Computing. Wenn keine große Zeitbeschränkung vorhanden ist, kann die komplexe Verarbeitung über einen spezialisierten Dienst remote erfolgen. Wenn Unternehmen komplexe Datenanalysen durchführen müssten, würde die IT die Daten an einen externen Dienst oder eine externe Stelle übertragen, wo viele Ressourcen zur Verarbeitung zur Verfügung standen.

Es war nicht so, dass Unternehmen warten wollten, um die gewünschten Ergebnisse zu erzielen. Es war einfach nicht wirtschaftlich machbar, genügend Rechenressourcen zu kaufen, um diese neuen Anforderungen zu bewältigen. In vielen Situationen würden Organisationen nur eine Auswahl von Daten erfassen, anstatt zu versuchen, alle Daten aus Kostengründen zu erfassen. Analysten wollten alle Daten, mussten sich aber mit Schnappschüssen begnügen, in der Hoffnung, die richtigen Daten zur richtigen Zeit zu erfassen.

Die wichtigsten Durchbrüche bei Hardware und Software haben die Datenverwaltungsbranche revolutioniert. Erstens haben Innovation und Nachfrage die Leistung erhöht und den Preis für Hardware gesenkt. Es entstand neue Software, die es verstand, diese Hardware zu nutzen, indem Prozesse wie Lastausgleich und -optimierung über ein großes Cluster von Knoten hinweg automatisiert wurden.

Die Software enthielt eingebaute Regeln, die verdeutlichten, dass bestimmte Workloads ein bestimmtes Leistungsniveau erforderten. Die Software behandelte alle Knoten so, als wären sie nur ein einziger großer Pool aus Datenverarbeitungs-, Speicher- und Netzwerkressourcen und bewegte Prozesse ohne Unterbrechung auf einen anderen Knoten, wenn ein Knoten fehlschlug, und verwendete dabei die Technologie der Virtualisierung.

Die sich verändernde Wirtschaftlichkeit von Computing und Big Data

Schneller Vorlauf und vieles hat sich geändert. In den letzten Jahren sind die Kosten für den Kauf von Computer- und Speicherressourcen drastisch gesunken. Unterstützt durch Virtualisierung veränderten Commodity-Server, die gruppiert werden konnten, und Blades, die in einem Rack vernetzt werden konnten, die Wirtschaftlichkeit von Computing. Diese Änderung fiel mit Innovationen bei Software-Automatisierungslösungen zusammen, die die Verwaltbarkeit dieser Systeme drastisch verbesserten.

Die Fähigkeit, verteiltes Rechnen und parallele Verarbeitungstechniken zu nutzen, hat die Landschaft dramatisch verändert und die Latenzzeit drastisch reduziert. Es gibt spezielle Fälle, wie etwa Hochfrequenzhandel (HFT), bei denen eine niedrige Latenz nur erreicht werden kann, indem Server an einem einzigen Ort physisch lokalisiert werden.

Das Problem mit der Latenzzeit für Big Data

Eines der mehrjährigen Probleme bei der Verwaltung von Daten - insbesondere große Datenmengen - war der Einfluss der Latenzzeit. Latenz ist die Verzögerung innerhalb eines Systems, die auf Verzögerungen bei der Ausführung einer Aufgabe beruht. Latenz ist ein Problem in jedem Aspekt der Datenverarbeitung, einschließlich Kommunikation, Datenverwaltung, Systemleistung und mehr.

Wenn Sie jemals ein drahtloses Telefon benutzt haben, haben Sie Latenz aus erster Hand erlebt. Es ist die Verzögerung in den Übertragungen zwischen Ihnen und Ihrem Anrufer. Gelegentlich hat die Latenz nur geringe Auswirkungen auf die Kundenzufriedenheit, z. B. wenn Unternehmen Ergebnisse hinter den Kulissen analysieren müssen, um eine neue Produktversion zu planen. Dies erfordert wahrscheinlich keine sofortige Antwort oder keinen Zugriff.

Je näher diese Antwort zum Zeitpunkt der Entscheidung jedoch einem Kunden kommt, desto größer ist die Wartezeit.

Verteiltes Computing und parallele Verarbeitungstechniken können einen signifikanten Unterschied in der Latenzzeit von Kunden, Lieferanten und Partnern ausmachen. Viele Big-Data-Anwendungen sind aufgrund der großen Datenanforderungen an die Geschwindigkeit und der Menge und Vielfalt der Daten auf niedrige Latenzzeiten angewiesen.

Es ist möglicherweise nicht möglich, eine Big-Data-Anwendung in einer Umgebung mit hoher Latenz zu erstellen, wenn eine hohe Leistung erforderlich ist. Die Notwendigkeit, die Daten nahezu in Echtzeit zu überprüfen, kann auch durch Latenz beeinträchtigt werden. Wenn Sie mit Echtzeitdaten zu tun haben, bedeutet eine hohe Latenz den Unterschied zwischen Erfolg und Misserfolg.

Big Data-Nachfrage trifft Lösungen

Das Wachstum des Internets als Plattform für alles, vom Handel bis zur Medizin, hat die Nachfrage nach einer neuen Generation des Datenmanagements verändert. In den späten 1990er Jahren, Motor und Internet-Unternehmen wie Google, Yahoo! und Amazon. com konnte ihre Geschäftsmodelle erweitern und dabei kostengünstige Hardware für Computing und Storage einsetzen.

Als Nächstes benötigten diese Unternehmen eine neue Generation von Softwaretechnologien, mit denen sie die enormen Datenmengen, die sie von Kunden erfassen konnten, monetarisieren konnten. Diese Unternehmen konnten nicht auf Ergebnisse der analytischen Verarbeitung warten. Sie benötigten die Fähigkeit, diese Daten nahezu in Echtzeit zu verarbeiten und zu analysieren.

Verteilte Rechengrundlagen für Big Data - Dummies

Die Wahl des Herausgebers

Verknüpfungen für Common View-Befehle in Excel 2007 - Dummys

Verknüpfungen für Common View-Befehle in Excel 2007 - Dummys

, Wenn Sie die Art ändern möchten, wie Sie sind Wenn Sie ein Excel 2007-Arbeitsblatt oder die Art und Weise, wie die Seite ausgelegt ist, ansehen, verwenden Sie diese Tastenkombinationen für die Ansichtsbefehle (Alt + Abkürzungstaste). Hotkeys Excel Multifunktionsleiste Befehl Funktion Alt + WN Ansicht | Normale Ansicht Gibt das Arbeitsblatt aus dem Seitenlayout oder der Seitenumbruchvorschau in die normale Ansicht zurück ...

Mit Excel 2016-Arbeitsmappen gespeichert wurden, die auf Ihren OneDrive-Dummies

Mit Excel 2016-Arbeitsmappen gespeichert wurden, die auf Ihren OneDrive-Dummies

Gespeichert wurden OneDrive in der Cloud. Gehen Sie folgendermaßen vor, um Excel 2016-Arbeitsmappen von Ihrem OneDrive freizugeben: Öffnen Sie die Arbeitsmappendatei, die Sie in Excel 2016 freigeben möchten, und klicken Sie dann ganz rechts in der Zeile mit der Multifunktionsleiste auf die Schaltfläche Freigeben. Excel wird geöffnet ...

Verknüpfungen zum Verschieben des Zellencursors in Excel 2007 - dummies

Verknüpfungen zum Verschieben des Zellencursors in Excel 2007 - dummies

Microsoft Office Excel 2007 bietet eine Vielzahl von Tastaturkürzel zum Auswählen einer neuen Zelle. Wenn Sie eine dieser Tastenkombinationen verwenden, scrollt das Programm automatisch einen neuen Teil des Arbeitsblatts in die Ansicht, wenn dies zum Bewegen des Zellencursors erforderlich ist. Sie finden diese Tastenanschläge und ihre Aktionen in der folgenden Tabelle. Tastatureingaben ...

Die Wahl des Herausgebers

Netzwerkverwaltung: Windows Gruppenrichtliniengrundlagen - Dummies

Netzwerkverwaltung: Windows Gruppenrichtliniengrundlagen - Dummies

Gruppenrichtlinie bezieht sich auf eine Funktion von Windows-Betriebssystemen, die Sie steuern, wie bestimmte Aspekte von Windows und anderer Microsoft-Software in Ihrem Netzwerk funktionieren. Viele Funktionen, die Sie möglicherweise in einer Verwaltungskonsole finden, z. B. Active Directory-Benutzer und -Computer, werden stattdessen von Gruppenrichtlinien gesteuert. Gruppenrichtlinie besteht aus ...

Netzwerkverwaltung: Windows Server 2008 Anmeldeskripts - Dummys

Netzwerkverwaltung: Windows Server 2008 Anmeldeskripts - Dummys

Ein Anmeldeskript ist eine Stapeldatei, die automatisch ausgeführt wird wann immer sich ein Benutzer anmeldet. Der häufigste Grund für die Verwendung eines Anmeldeskripts besteht darin, die Netzwerkfreigaben zuzuordnen, auf die der Benutzer zugreifen muss. Hier ist ein einfaches Anmeldeskript, das drei Netzwerkfreigaben abbildet: echo off net use m: server1sharesadmin net ...

Netzwerkverwaltung: Windows Firewalls - Dummies

Netzwerkverwaltung: Windows Firewalls - Dummies

Windows enthält eine integrierte Firewall, die einen grundlegenden Paketfilterungs-Firewallschutz bietet. In den meisten Fällen sollten Sie einen dedizierten Firewall-Router verwenden, da diese Geräte bessere Sicherheitsfunktionen bieten als die integrierte Windows-Firewall. Dennoch ist die eingebaute Firewall für Heimnetzwerke oder sehr kleine Büronetzwerke geeignet. Hier sind die Schritte, die aktiviert werden ...

Die Wahl des Herausgebers

Wie sich einzelne kunden mit sozialen medien auseinandersetzen - dummies

Wie sich einzelne kunden mit sozialen medien auseinandersetzen - dummies

Im heutigen social-media-web haben menschen mehr macht als je. Verbraucher sind sich ihrer Macht zunehmend bewusst: Eine Person mit einem Blog kann Produkte überprüfen, das Bewusstsein für eine Marke schärfen und den Umsatz steigern. Jemand kann seine Meinung über eine Marke in seinen bevorzugten sozialen Netzwerken teilen und ihre Gedanken können sich exponentiell verbreiten. ...

Wie Online-Communities mit Social Media interagieren - dummies

Wie Online-Communities mit Social Media interagieren - dummies

Online-Community ist das Kollektiv, ein virtueller Ort und die Gruppen von Menschen, die das Social-Media-Engagement fördern. Ihre Social-Media-Engagements können nicht in einem Vakuum stattfinden. Die Aktivitäten des Engagements in sozialen Medien finden innerhalb von Online-Communities statt, sogar in Communities, die nur aus zwei Personen bestehen, wie z. B. Ihnen und jemand anderem. Social-Media-Plattformen und ...

Host beliebte Werbegeschenke auf Ihre Mutter Blog - Dummies

Host beliebte Werbegeschenke auf Ihre Mutter Blog - Dummies

Eine erfolgreiche Mutter Blogging-Website ist 5MinutesForMom. com. Die Zwillingsschwestern Janice Croze und Susan Carraretto schienen vom ersten Tag an mühelos Gemeinschaft und Verkehr aufzubauen. Einer der Wege, wie sie das taten, war, Giveaways auf ihrem Blog zu betreiben. Sie waren einer der allerersten Mutter Blogs, um diese Strategie als eine Möglichkeit zu verwenden ...