Zuhause Persönliche Finanzen Wie man die Gültigkeit, Wahrhaftigkeit und Volatilität von Big Data sicherstellt - Dummies

Wie man die Gültigkeit, Wahrhaftigkeit und Volatilität von Big Data sicherstellt - Dummies

Inhaltsverzeichnis:

Video: Philo meets Psyche: Veränderung, Anstand und Wahrhaftigkeit 2025

Video: Philo meets Psyche: Veränderung, Anstand und Wahrhaftigkeit 2025
Anonim

Hohes Volumen, hohe Vielfalt und hohe Geschwindigkeit sind die wesentlichen Merkmale von Große Daten. Aber auch andere Merkmale von Big Data sind wichtig, insbesondere wenn Sie Big Data auf operative Prozesse anwenden. Dieser zweite Satz von "V" -Charakteristika, die für die Operationalisierung großer Daten von Bedeutung sind, umfasst

  • Gültigkeit: Sind die Daten für die beabsichtigte Verwendung korrekt und genau?

  • Wahrhaftigkeit: Sind die Ergebnisse für den gegebenen Problemraum sinnvoll?

  • Volatilität: Wie lange müssen Sie diese Daten speichern?

Große Datengültigkeit

Sie wollen genaue Ergebnisse. Aber in der Anfangsphase der Analyse von Petabytes an Daten ist es wahrscheinlich, dass Sie sich keine Gedanken darüber machen, wie gültig jedes Datenelement ist. Dieser anfängliche Strom von Big Data könnte tatsächlich ziemlich schmutzig sein. In den Anfangsphasen ist es wichtiger zu sehen, ob es Beziehungen zwischen Elementen innerhalb dieser massiven Datenquelle gibt, als sicherzustellen, dass alle Elemente gültig sind.

Nachdem jedoch eine Organisation feststellt, dass Teile dieser anfänglichen Datenanalyse wichtig sind, muss diese Teilmenge der Big Data validiert werden, da sie nun auf eine Betriebsbedingung angewendet wird. Wenn sich die Daten von explorativ zu verwertbar bewegen, müssen die Daten validiert werden. Die Gültigkeit großer Datenquellen und die nachfolgende Analyse müssen genau sein, wenn Sie die Ergebnisse für die Entscheidungsfindung verwenden möchten.

Gültige Eingabedaten, gefolgt von korrekter Verarbeitung der Daten, sollten genaue Ergebnisse liefern. Bei Big Data müssen Sie hinsichtlich der Gültigkeit besonders wachsam sein. Im Gesundheitswesen können Sie beispielsweise Daten aus einer klinischen Studie haben, die mit den Krankheitssymptomen eines Patienten in Zusammenhang stehen könnten. Aber ein Arzt, der diese Person behandelt, kann die Ergebnisse der klinischen Prüfung nicht einfach so einnehmen, als würde er sie validieren.

Stellen Sie sich vor, dass der Wettersatellit anzeigt, dass ein Sturm in einem Teil der Welt beginnt. Wie wirkt sich dieser Sturm auf Individuen aus? Mit etwa einer halben Milliarde Nutzern ist es möglich, Twitter-Streams zu analysieren, um die Auswirkungen eines Sturms auf die lokale Bevölkerung zu bestimmen. Daher könnte die Verwendung von Twitter in Kombination mit Daten eines Wettersatelliten Forschern helfen, die Richtigkeit einer Wettervorhersage zu verstehen.

Große Datenvolatilität

Wenn Sie über gültige Daten verfügen und die Richtigkeit der Ergebnisse nachweisen können, wie lange müssen die Daten dann "leben", um Ihre Anforderungen zu erfüllen? In einer Standarddateneinstellung können Sie Daten jahrzehntelang speichern, weil Sie im Laufe der Zeit ein Verständnis dafür entwickelt haben, welche Daten für das, was Sie damit tun, wichtig sind.Sie haben Regeln für die Datenwährung und -verfügbarkeit festgelegt, die Ihren Arbeitsprozessen zugeordnet sind.

Zum Beispiel halten einige Unternehmen möglicherweise nur das letzte Jahr ihrer Kundendaten und Transaktionen in ihren Geschäftssystemen. Dies gewährleistet eine schnelle Abfrage dieser Informationen bei Bedarf. Wenn sie sich ein voriges Jahr ansehen müssen, muss das IT-Team möglicherweise Daten aus dem Offlinespeicher wiederherstellen, um die Anforderung zu berücksichtigen. Bei großen Daten wird dieses Problem vergrößert.

Wenn die Speicherkapazität begrenzt ist, sehen Sie sich die großen Datenquellen an, um zu ermitteln, was Sie sammeln müssen und wie lange Sie sie aufbewahren müssen. Bei einigen großen Datenquellen müssen Sie möglicherweise nur Daten für eine schnelle Analyse sammeln.

Sie könnten die Informationen dann lokal zur weiteren Verarbeitung speichern. Wenn Sie nicht genügend Speicherplatz für all diese Daten haben, können Sie die Daten "on the fly" verarbeiten und nur relevante Informationen lokal speichern. Wie lange Sie große Datenmengen verfügbar halten, hängt von einigen Faktoren ab:

  • Wie viele Daten werden an der Quelle gespeichert?

  • Müssen Sie die Daten wiederholt verarbeiten?

  • Müssen Sie die Daten verarbeiten, zusätzliche Daten sammeln und mehr verarbeiten?

  • Haben Sie Regeln oder Vorschriften, die eine Datenspeicherung erfordern?

  • Sind Ihre Kunden für Ihre Arbeit auf Ihre Daten angewiesen?

  • Haben die Daten noch einen Wert oder ist sie nicht mehr relevant?

Aufgrund des Volumens, der Vielfalt und der Geschwindigkeit von Big Data müssen Sie die Volatilität verstehen. Für einige Quellen sind die Daten immer vorhanden; für andere ist das nicht der Fall. Wenn Sie wissen, welche Daten wie lange da sind und wie lange Sie sie verwenden können, können Sie Aufbewahrungsanforderungen und Richtlinien für Big Data definieren.

Big Data wird als Verbraucher dazu beitragen, ein besseres Profil zu definieren, wie und wann Sie Waren und Dienstleistungen kaufen. Als Patient werden Big Data dabei helfen, einen individuelleren Behandlungsansatz und Gesundheitsschutz zu definieren. Big Data hilft Ihnen dabei, bessere Wege zu finden, Ihre Produkte und Dienstleistungen zu gestalten und zu liefern.

Dies geschieht nur, wenn Big Data in die Betriebsprozesse von Unternehmen und Organisationen integriert wird.

Wie man die Gültigkeit, Wahrhaftigkeit und Volatilität von Big Data sicherstellt - Dummies

Die Wahl des Herausgebers

Anzeigen von elektrischen Signalen an einem Oszilloskop - Dummies

Anzeigen von elektrischen Signalen an einem Oszilloskop - Dummies

Ein Oszilloskop ermöglicht das Anzeigen eines elektrischen Signals durch Anzeigen einer Spannung. variiert mit der Zeit als eine Spur über eine Anzeige. Die vertikale Achsenspannung zeigt die Größe der Spannung (auch Amplitude genannt) an, und die horizontale Achse repräsentiert die Zeit. (Denken Sie daran, Gleichungen in Mathematik-Klasse zu zeichnen? Nun, die Anzeige auf einem Bereich ist wirklich ...

Eintauchen in DX-ing - Dummies

Eintauchen in DX-ing - Dummies

Drücken Sie Ihre Station, um Kontakte über immer größere Entfernungen herzustellen (DX bedeutet entfernte Stationen ist die zweitälteste Aktivität im gesamten Amateurfunk. Irgendwo im Äther ist eine Station immer nur verlockend außer Reichweite und die Herausforderung, diese Station zu kontaktieren, ist der Zweck von DX-ing. Tausende von Schinken über ...

Steuern Sie Ihre Elektronik über einen Parallelport - Dummies

Steuern Sie Ihre Elektronik über einen Parallelport - Dummies

Werfen Sie nicht weg alter Computer! Wenn es einen Parallelport hat, können Sie damit Ihre elektronischen Gadgets steuern. Bis vor einigen Jahren waren alle Computer mit einem parallelen Anschluss ausgestattet, der hauptsächlich zum Anschluss an einen Drucker verwendet wurde. Heutzutage verbinden sich die meisten Drucker über USB-Ports mit Computern. Der Parallelport ...

Die Wahl des Herausgebers

Neuro-linguistisches Programmieren: Zu Deinem Selbst Selbst Seien Wahr - Attrappen

Neuro-linguistisches Programmieren: Zu Deinem Selbst Selbst Seien Wahr - Attrappen

Fahren nicht durch dein Leben mit einem Fuß auf der Bremse, weil du versuchst, den Erwartungen anderer Menschen gerecht zu werden. Persönliche Verantwortung und echtes Autofahren ist viel einfacher, wenn man versteht, wer man im Mittelpunkt steht und was man im Leben erreichen will. Sie können Maßnahmen ergreifen, wenn Sie ...

Bewegen Jenseits von Typ A: Abheben der Uhr - Dummies

Bewegen Jenseits von Typ A: Abheben der Uhr - Dummies

Typ A sind von der Zeit besessen. "Das nimmt zu viel Zeit in Anspruch" "Verdammt, es wird spät - ich werde nie pünktlich fertig sein." "Ich wünschte, sie würden sich beeilen. "Typ A hat ein beschleunigtes Zeitgefühl. Sie fühlen, wie die Zeit im Laufe des Tages immer mehr "abrutscht". Dies führt zu einem ...

Stimmung Störungen und ihre Behandlung Medikamente - Dummies

Stimmung Störungen und ihre Behandlung Medikamente - Dummies

Stimmungsstörungen, auch als affektive Störungen bekannt, sind eine Gruppe von Krankheiten gekennzeichnet durch eine deutliche Veränderung des emotionalen Zustandes einer Person. Die drei häufigsten Stimmungsstörungen sind bipolare Störung, Dysthymie und Major Depression. Stimmungsstörungen betreffen fast 21 Prozent der Erwachsenen in den Vereinigten Staaten. Die meisten Betroffenen finden jedoch ein gewisses Maß an ...

Die Wahl des Herausgebers

So ​​wählen Sie die von Ihnen benötigten AWS-Dienste aus - Attrappen

So ​​wählen Sie die von Ihnen benötigten AWS-Dienste aus - Attrappen

Denken Sie daran, dass Sie nur 12 Monate frei haben Entscheidungsprozess darüber, welche AWS-Dienste (Amazon Web Services) in Ihrem Unternehmen verwendet werden sollen. Zwölf Monate mögen sehr viel Zeit in Anspruch nehmen, aber Sie werden feststellen, dass es vor Ihren Augen verdunstet, wenn Sie versuchen, Ihre täglichen Aufgaben, Meetings, ... zu bewältigen.

Amazon Web Services für Dummies Cheat Sheet - Dummies

Amazon Web Services für Dummies Cheat Sheet - Dummies

Amazon Web Services (AWS) ist ein Cloud-Dienstanbieter, der bietet einfachen Zugriff auf eine Vielzahl von nützlichen Computerressourcen, die alle auf bedarfsgerechte, kosteneffiziente Weise angeboten werden. Wenn Sie ein IT-Praktiker sind, der bereit ist, Amazon Web Services zu nutzen, brechen Sie Ihre alten Anwendungsmuster-Gewohnheiten und implementieren Sie neue Ansätze, die AWS-Eigenschaften und ...

AWS-Sicherheitsprobleme - Dummies

AWS-Sicherheitsprobleme - Dummies

Für die Verwendung von AWS (Amazon Web Services) müssen Sie die Sicherheit Ihres Computers in einem Weg. Administratoren und Sicherheitsexperten können sich schnell verrückt machen, wenn sie versuchen, diese miteinander verbundenen Computer sicher zu halten, aber das ist Teil der Stellenbeschreibung. Sie müssen Best Practices bei der Sicherung der Computersysteme und der darin enthaltenen Daten befolgen.