Video: February 2016 Webinar Series - Architectural Patterns for Big Data on AWS 2024
Viele Unternehmen untersuchen große Datenprobleme und entwickeln innovative Lösungen. Jetzt ist es an der Zeit, auf einige Best Practices, oder Grundprinzipien zu achten, die Ihnen bei Beginn Ihrer Big Data-Reise gute Dienste leisten.
In der Realität passt Big Data Integration in den gesamten Integrationsprozess von Daten in Ihrem Unternehmen. Daher können Sie nicht einfach alles wegwerfen, was Sie aus der Datenintegration herkömmlicher Datenquellen gelernt haben. Es gelten die gleichen Regeln, egal ob Sie über traditionelle Datenverwaltung oder Big Data Management nachdenken.
Halten Sie diese Schlüsselprobleme an der Spitze Ihrer Prioritätenliste für Big Data-Integration:
-
Halten Sie die Datenqualität in der Perspektive. Ihre Betonung der Datenqualität hängt vom Stadium Ihrer Big-Data-Analyse ab. Erwarten Sie nicht, dass Sie die Datenqualität kontrollieren können, wenn Sie Ihre erste Analyse mit großen Datenmengen durchführen. Wenn Sie jedoch Ihre Big Data eingrenzen, um eine Untergruppe zu ermitteln, die für Ihre Organisation am sinnvollsten ist, müssen Sie sich auf die Datenqualität konzentrieren.
Letztlich wird Datenqualität wichtig, wenn Sie möchten, dass Ihre Ergebnisse im Kontext mit Ihren historischen Daten verstanden werden. Da sich Ihr Unternehmen mehr und mehr auf die Analyse als wichtiges Planungstool verlässt, kann die Datenqualität den Unterschied zwischen Erfolg und Misserfolg ausmachen.
-
Betrachten Sie Echtzeit-Datenanforderungen. Big Data wird Streaming-Daten in den Vordergrund rücken. Daher müssen Sie ein klares Verständnis dafür haben, wie Sie Daten in Bewegung in Ihre Umgebung integrieren, um vorhersehbare Analysen zu ermöglichen.
-
Erstellen Sie keine neuen Informationssilos. Während sich ein Großteil der Betonung auf Big Data auf Hadoop und andere unstrukturierte und semi-strukturierte Quellen konzentriert, denken Sie daran, dass Sie diese Daten im Zusammenhang mit dem Unternehmen verwalten müssen. Sie müssen daher diese Quellen in Ihre Geschäftsdaten und Ihr Data Warehouse integrieren.