Katalogisieren vorhandener Extrahierungsdateien - Dummies
Wenn Sie anfangen zu überlegen, was mit den Extraktdateien und anderen Arten von Data-Warehouse-Umgebungen, die in Ihrer Organisation existieren, müssen Sie finden - was Sie möglicherweise als schwierig empfinden, wenn man die Eigenart dieser Umgebungen bedenkt. Hier ist ein Hinweis: Folgen Sie den Berichten. Durch Gruppenarbeitssitzungen und individuelle Besprechungen ...
Wie man ein Smart Shopper bei Data Warehousing Konferenzen wird - Dummies
Machen keinen Fehler: Sie können einen enormen Nutzen aus der Teilnahme an Konferenzen oder Messen ziehen, einschließlich solcher, die auf Data Warehousing ausgerichtet sind. Anbieter zeigen und demonstrieren ihre neuesten Produkte, Sie erhalten Fallstudien aus der Praxis und Geschichten über erfolgreiche Data Warehousing-Implementierungen, und Sie erhalten einzigartige Einblicke in aufkommende Probleme ...
Wie man Big Data einbindet - Dummies
Reicht nicht aus, wenn man nur auf große Datenquellen zugreifen kann. Sie müssen diese Quellen integrieren. Bald wird es Petabytes von Daten und Hunderte von Zugriffsmechanismen für Sie zur Auswahl geben. Aber welche Datenströme und Daten benötigen Sie? Verstehen Sie das Problem, das Sie lösen wollen Identifizieren Sie die ...
Wie man die Gültigkeit, Wahrhaftigkeit und Volatilität von Big Data sicherstellt - Dummies
Hohe Lautstärke, hohe Vielfalt und hohe Geschwindigkeit sind die wesentlichen Merkmale von Big Data. Aber auch andere Merkmale von Big Data sind wichtig, insbesondere wenn Sie Big Data auf operative Prozesse anwenden. Dieser zweite Satz von "V" -Eigenschaften, der für die Operationalisierung großer Daten von entscheidender Bedeutung ist, umfasst die Gültigkeit: Sind die Daten korrekt und genau für die ...
Wie man die Cloud für Big Data nutzt - Dummies
Klar, die Natur von Die Cloud macht sie zu einer idealen Computerumgebung für Big Data. Wie können Sie also Big Data zusammen mit der Cloud nutzen? Hier einige Beispiele: IaaS in einer öffentlichen Cloud: In diesem Szenario würden Sie die Infrastruktur eines öffentlichen Cloud-Providers für Ihre Big Data Services nutzen, weil Sie ...
Erstellen einer Big Data-Implementierungs-Roadmap - Dummies
Big-Data-Implementierungspläne oder Straßenkarten hängt von Ihren Geschäftszielen, der Reife Ihrer Datenverwaltungsumgebung und dem Risiko ab, das Ihr Unternehmen aufnehmen kann. Beginnen Sie Ihre Planung, indem Sie alle Probleme berücksichtigen, die es Ihnen ermöglichen, eine Implementierungsstraßenkarte zu bestimmen. Geschäftsnotwendigkeit und ...
Implementieren eines Data Mart - Quickly - Dummies
Unabhängig davon, wie Sie das Universum möglicher Inhalte in Teilmenge für Ihre Data Mart, denken Sie daran, dass Sie schnell implementieren müssen, um maximalen geschäftlichen Nutzen aus Ihrem Data Mart zu erhalten. Hier sind die drei Schlüssel für eine schnelle Implementierung: Folgen Sie einer iterativen, abgestuften Methodik. Sie investieren die Mehrheit von ...
Wie man die architektonische Grundlage für Big Data - Dummies
Setzt, ist es wichtig, eine starke architektonische Fundament, wenn Sie mit Big Data erfolgreich sein wollen. Neben der Unterstützung der funktionalen Anforderungen ist es wichtig, die erforderliche Leistung zu unterstützen. Ihre Bedürfnisse hängen von der Art der Analyse ab, die Sie unterstützen. Sie benötigen die richtige Rechenleistung ...
Zum Optimieren von MapReduce-Aufgaben - Dummys
Abgesehen von der Optimierung des eigentlichen Anwendungscodes mit MapReduce für Big Data-Projekte können Sie Verwenden Sie einige Optimierungstechniken, um die Zuverlässigkeit und Leistung zu verbessern. Sie fallen in drei Kategorien: Hardware / Netzwerktopologie, Synchronisation und Dateisystem. Big-Data-Hardware / Netzwerktopologie Unabhängig von der Anwendung werden schnellste Hardware und Netzwerke die schnellsten Laufzeiten liefern ...
Identifizieren Sie die Daten, die Sie für Ihre Big Data benötigen - Dummies
Bestandsaufnahme der Daten, die Sie befassen sich in Ihrem Big-Data-Projekt. Viele Unternehmen erkennen, dass viele intern generierte Daten in der Vergangenheit nicht vollständig genutzt wurden. Durch die Nutzung neuer Tools erhalten Unternehmen neue Einblicke in bisher nicht genutzte Quellen unstrukturierter Daten in ...
Verwendung von MapReduce für Big Data - Dummies
MapReduce ist ein Software-Framework, das sich ideal für Big Data eignet, da Es ermöglicht Entwicklern, Programme zu schreiben, die große Mengen an unstrukturierten Daten parallel über eine verteilte Gruppe von Prozessoren verarbeiten können. Die Kartenfunktion für Big Data Die Kartenfunktion ist seit Jahren Bestandteil vieler funktionaler Programmiersprachen. Map ...
Schicht 0 des Big Data Stack: Redundante physikalische Infrastruktur - Dummies
Auf der untersten Ebene der Big Data Stack ist die physische Infrastruktur. Ihr Unternehmen verfügt möglicherweise bereits über ein Rechenzentrum oder hat Investitionen in physische Infrastrukturen getätigt. Daher möchten Sie einen Weg finden, die vorhandenen Ressourcen zu nutzen. Big-Data-Implementierungen haben sehr spezifische Anforderungen an alle Elemente in der Referenzarchitektur, ...
Schicht 2 des Big Data Stack: Operational Databases - Dummies
Im Kern jeder großen Datenumgebung und Schicht 2 des Big-Data-Stacks sind die Datenbank-Engines, die die Sammlung von Datenelementen enthalten, die für Ihr Unternehmen relevant sind. Diese Engines müssen schnell, skalierbar und felsenfest sein. Sie sind nicht alle gleich geschaffen, und bestimmte Big-Data-Umgebungen werden besser funktionieren mit ...
Schicht 3 des Big Data Stack: Organisieren von Data Services und Tools - Dummies
Organisieren von Datendiensten und -werkzeugen, Schicht 3 des Big-Data-Stacks, Erfassen, Validieren und Zusammenstellen verschiedener Big-Data-Elemente in kontextuell relevanten Sammlungen. Da Big Data massiv ist, haben sich Techniken entwickelt, um die Daten effizient und nahtlos zu verarbeiten. MapReduce ist eine stark genutzte Technik. Es genügt hier zu sagen, dass viele dieser organisatorischen ...
Schlüssel-Wert Paar Datenbanken in einer Big Data Umgebung - Dummies
Bei weitem, das einfachste Die NoSQL-Datenbanken (nicht nur SQL) in einer Big Data-Umgebung sind solche, die das Schlüssel-Wert-Paar-Modell (KVP-Modell) verwenden. KVP-Datenbanken benötigen kein Schema (wie RDBMSs) und bieten große Flexibilität und Skalierbarkeit. KVP-Datenbanken bieten keine ACID-Fähigkeit (Atomicity, Consistency, Isolation, Durability) und erfordern, dass Implementierer über Daten nachdenken ...
Treffen Sie sich mit Data Warehousing Representatives - Dummies
Einkaufen für Data Warehousing-Produkte kann Meetings mit Unternehmensvertretern beinhalten. Bevor ein Verkaufsrepräsentant eines Verkäufers einen Fuß in Ihr Büro setzt oder eine Webkonferenz mit Ihnen initiiert, verdeutlichen Sie genau, was Sie während des ein oder zweistündigen Erstgesprächs erwarten. Sie sollten mindestens Folgendes tun: Hören Sie eine Präsentation von ...
Schicht 1 des Big Data Stack: Sicherheitsinfrastruktur - Dummies
Sicherheits- und Datenschutzanforderungen, Schicht 1 des Big-Data-Stacks ähneln den Anforderungen für herkömmliche Datenumgebungen. Die Sicherheitsanforderungen müssen eng an spezifische Geschäftsanforderungen angepasst werden. Einige einzigartige Herausforderungen entstehen, wenn Big Data Teil der Strategie wird: Datenzugriff: Der Benutzerzugriff auf rohe oder berechnete Big Data hat ...
Schicht 4 des Big Data Stack: Analytical Data Warehouses - Dummies
Das Data Warehouse, Layer 4 des Big Data-Stacks und sein Begleiter, der Data Mart, sind seit langem die primären Techniken, mit denen Organisationen Daten optimieren, um Entscheidungsträgern zu helfen. In der Regel enthalten Data Warehouses und Marts normalisierte Daten, die aus einer Vielzahl von Quellen gesammelt und zusammengestellt wurden, um die Analyse des Geschäfts zu erleichtern. Daten ...
Verwaltung von Virtualisierung für Big Data - Dummies
Virtualisierung trennt Ressourcen und Dienste von der zugrunde liegenden physischen Bereitstellungsumgebung, sodass Sie viele virtuelle Systeme in einem einzigen physischen System. Einer der Hauptgründe, warum Unternehmen Virtualisierung implementiert haben, ist die Verbesserung der Leistung und Effizienz der Verarbeitung einer Vielzahl von Workloads. Der Big-Data-Hypervisor In einer idealen ...
Middleware für Data Warehousing - Dummies
Middleware ist eine Software, die Softwarekomponenten miteinander verbindet. In einer Data Warehousing-Umgebung sind die Middleware-Services die Gruppe von Programmen und Routinen, die Folgendes ausführen: Ziehen Sie Daten aus der Quelle (oder den Quellen). Vergewissern Sie sich, dass die Daten korrekt sind. Verschieben Sie die Daten bei Bedarf von Plattform zu Plattform. Behandeln Sie alle notwendigen ...
Stammdatenverwaltung (MDM) - Dummies
In den letzten Jahren ODS-artige Rückmeldesysteme definiert für einen bestimmten Zweck - Referenzdaten - sind entstanden. Alle Systeme sind mit Referenzdaten gepackt. Diese Daten können den Datensatz enthalten, den Sie verwenden, um die Phase einer Verkaufsgelegenheit zu beschreiben (zum Beispiel einen Lead, einen qualifizierten Lead, eine Opportunity, eine prognostizierte Opportunity und ...
Middleware Services: Data Mapping und Transformation - Dummies
Diese Abbildung zeigt eine Umgebung, in der Daten extrahiert werden drei verschiedene Datenquellen für die Aufnahme in ein Data Warehouse, und jede der drei Quellen befindet sich auf einer anderen Plattform. Irgendwann im Middleware-Prozess müssen diese QA-Extrakte für einen kombinierten Mapping- und Transformationsprozess zusammengeführt werden. Die ...
Middleware Services: Datenbewegung und Daten laden - Dummies
In den meisten Situationen die beiden Middleware-Dienste - Auswahl und Extraktion und Qualitätssicherung - finden auf der gleichen Plattform (System) statt, auf der sich die Datenquelle befindet. Wenn Ihr Data Warehouse jedoch auf einer anderen Plattform als der Datenquelle gehostet wird, müssen Sie einen Datenbewegungsdienst verwenden, um das System-zu-System zu aktivieren.
Middleware Dienste: Datenauswahl und Extraktionen - Dummies
Der primäre Zweck des Datenauswahl- und -extraktionsdienstes Wählen Sie aus einer Datenquelle die Daten aus, die Sie in das Data Warehouse verschieben möchten, und extrahieren Sie diese Daten dann in ein Formular, das für Qualitätssicherungsdienste bereitgestellt werden kann. Sie können einen von zwei verschiedenen Typen verwenden ...
Meine Big Data mit Hive - Dummies
Hive ist eine Batch-orientierte Data-Warehousing-Schicht auf den Kernelementen von Hadoop (HDFS und MapReduce) und ist sehr nützlich in Big Data. Es bietet Benutzern, die SQL kennen, eine einfache SQL-lite-Implementierung namens HiveQL, ohne den Zugriff über Mapper und Reducer zu opfern. Mit Hive erhalten Sie das Beste aus beiden Welten: SQL-ähnlicher Zugriff ...
Multidimensionale Datenbanken - Dummies
Dies ist nicht das erste Mal in der jüngeren Geschichte, dass neue Arten von Datenbankprodukten entstanden sind und RDBMS-Ineffizienzen überwinden .. In den 1980er Jahren wurde eine Klasse von Anwendungen identifiziert, in denen RDBMS-Produkte die Datenverwaltungsbedürfnisse (insbesondere die zu diesem Zeitpunkt verfügbare Generation von RDBMS) schlecht handhabten. Diese Anwendungen benötigten alle benutzerspezifische Datentypen, die ...
Middleware Services: Datenqualitätssicherung - Dummies
Sie sollten im Flow zwei verschiedene Qualitätssicherungsservices (QS) einrichten von Middleware-Diensten. Sie müssen die ersten QA-Tasks für den Extrakt aus der Datenquelle ausführen, bevor Sie weitere Middleware-Services ausführen. Datenqualitätssicherung: Teil I Versuchen Sie, Fehler und Probleme so früh wie möglich zu erfassen (und zu korrigieren) ...
Nicht relationale Datenbanken in einer Big Data Umgebung - Dummies
Nicht relationale Datenbanken verlassen sich nicht auf das endemische Tabellen- / Schlüsselmodell zu RDBMS (relationale Datenbankverwaltungssysteme). Kurz gesagt, Spezialdaten in der Big-Data-Welt erfordern spezielle Persistenz- und Datenmanipulationstechniken. Obwohl diese neuen Arten von Datenbanken einige Antworten auf Ihre Big-Data-Herausforderungen bieten, sind sie kein Express-Ticket zum Ziel ...
Verwenden Sie Big Data - Dummies
Textanalysen können verwendet werden, um einen besseren Einblick in Daten zu erhalten. Also, was ist, wenn die Daten Big Data sind? Das würde bedeuten, dass die analysierten unstrukturierten Daten ein hohes Volumen, eine hohe Geschwindigkeit oder beides sind. Big Data und die Stimme des Kunden Die Optimierung des Kundenerlebnisses und die Verbesserung der Kundenbindung sind die dominanten Treiber für ...
Neun Zeichen für ein erfolgreiches Data Warehousing-Projekt - Dummies
Nur weil sich alle in der Cafeteria des Unternehmens zu Kuchen versammeln und Verputzen der Wände mit Glückwunschbannern bedeutet nicht, dass Ihr Data-Warehousing-Projekt ein Erfolg war. Dieses Kapitel gibt Ihnen einige Möglichkeiten zu sagen, dass Sie wirklich erfolgreich waren. Der Geschäftsführersponsor sagt: "Dieses Ding funktioniert - es funktioniert wirklich! "Angenommen, ein Senior ...
ÄNdern von Business Intelligence-Produkten zur Verarbeitung von Big Data - Dummies
Große Daten verarbeiten, so dass sie einige Änderungen benötigen. Sie wurden entwickelt, um mit hoch strukturierten, gut verstandenen Daten zu arbeiten, die oft in einem relationalen Datenrepository gespeichert und auf Ihrem Desktop oder Laptop angezeigt werden. Diese traditionelle Business-Intelligence-Analyse wird in der Regel auf Snapshots von Daten angewendet ...
Andere Typen von Business Intelligence - Dummies
Leider ist das ordentliche, organisierte Modell mit vier verschiedenen Arten von Business-Intelligence-Kategorien (Abfrage und Reporting, Business Analysis [OLAP], Data Mining sowie Dashboards und Scorecards) können für komplexere Anwendungen erweitert werden. Zum Beispiel kann ein OLAP- oder Dashboard-Tool über geographische Informationssysteme (GIS) verfügen - oder auch nicht. Wie in ...
Relationale Produkte und Data Warehousing - Dummies
Hier finden Sie einige der führenden relationalen Datenbankprodukte, die Sie möglicherweise für Ihre Daten verwenden möchten. Warenhaus. Fast alle diese Anbieter haben in den letzten Jahren zusätzliche Produkte erworben, darunter OLAP- oder mehrdimensional orientierte Technologien und andere RDBMS, um sehr unterschiedliche Plattformen zu unterstützen und in ihre Produktlinien und Architekturen zu integrieren. Vielleicht möchten Sie ...
Vorbereitung für Semantik in Data Warehousing - Dummies
Wenn Sie bewerten, wie die mit Data Warehousing verbundenen Technologien funktionieren, von Metadaten wird innerhalb des Tools auf proprietäre Weise verwaltet. Einige haben in der Vergangenheit versucht, das Integrationsproblem zu lösen, indem sie eine weitere Technologie, die als technische Metadaten-Repositories bekannt sind, schaffen, um all diese Metadaten aus den verschiedenen Tools zu integrieren. Solches ...
Sollten Sie Tools oder benutzerdefinierten Code verwenden? - Dummies
In den frühen Tagen des Data Warehousing handhabten die meisten Unternehmen Middleware-Dienste durch benutzerdefinierte Codierung und nicht mit den wenigen zur Zeit verfügbaren Tools, wie in diesem Beispiel gezeigt: Eine Organisation schreibt ein Programm in eine Programmierung. Sprache wie COBOL, oder vielleicht in einer Umgebung wie SAS, um die Datenextrakte zu verarbeiten ...
Abfrage- und Berichterstellungstools für Data Warehousing - Dummies
Mit einem Abfrage- und Berichtstool können Sie regelmäßige Berichte erstellen, erstellen und erstellen. organisierte Listen und führen tabellarisches Berichten und Abfragen durch. Hier sind einige Abfrage- und Reporting-Tools, mit denen Sie sich vertraut machen können. Die Rolle von SQL SQL ist die offizielle Abfragesprache der Datenbank, die für den Zugriff und die Aktualisierung der in einem relationalen Datenbankverwaltungssystem enthaltenen Daten verwendet wird.
Replikationsdienste für Data Warehousing - Dummies
Replikations-Middleware-Dienste kombinieren Auswahl und Extrahierung, Bewegung und Laden von einer Datenbank zu ein oder mehrere andere, die normalerweise von einem einzigen DBMS-Produkt verwaltet werden. (Die Quelldatenbank und alle Ziele sind alle Oracle, alle Sybase oder alle Microsoft SQL Server, zum Beispiel.) Obwohl die Replikationsdienstleistungsfähigkeiten bei DBMS-Produkten unterschiedlich sind, waren sie traditionell ...
RDBMSs in einer Big Data Umgebung - Dummies
Big Data wird zu einem wichtigen Element in der Art und Weise, wie Unternehmen -Volume Daten in der richtigen Geschwindigkeit, um bestimmte Datenprobleme zu lösen. Relationale Datenbank-Management-Systeme sind wichtig für dieses hohe Volumen. Big Data lebt nicht isoliert. Um effektiv zu sein, müssen Unternehmen oft in der Lage sein, die Ergebnisse von ...