Zuhause Persönliche Finanzen Unstrukturierte Daten in einer Big Data-Umgebung - Dummies

Unstrukturierte Daten in einer Big Data-Umgebung - Dummies

Inhaltsverzeichnis:

Video: Wie vereinfacht SAS Viya das Datenmanagement? 2025

Video: Wie vereinfacht SAS Viya das Datenmanagement? 2025
Anonim

Unstrukturierte Daten sind Daten, die nicht einem bestimmten Format für Big Data folgen. Wenn 20 Prozent der für Unternehmen verfügbaren Daten strukturierte Daten sind, sind die anderen 80 Prozent unstrukturiert. Unstrukturierte Daten sind die meisten Daten, auf die Sie stoßen werden. Bis vor kurzem unterstützte die Technologie jedoch nicht wirklich viel damit, außer sie zu speichern oder manuell zu analysieren.

Quellen für unstrukturierte Big Data

Unstrukturierte Daten sind überall. Tatsächlich leben die meisten Menschen und Organisationen ihr Leben mit unstrukturierten Daten. Genau wie bei strukturierten Daten werden unstrukturierte Daten entweder maschinell generiert oder vom Menschen generiert.

Hier sind einige Beispiele für maschinell erzeugte unstrukturierte Daten:

  • Satellitenbilder: Dazu gehören Wetterdaten oder die Daten, die die Regierung in ihren Satellitenüberwachungsbildern erfasst. Denken Sie nur an Google Earth, und Sie bekommen ein Bild.

  • Wissenschaftliche Daten: Dazu gehören seismische Bilder, atmosphärische Daten und Hochenergiephysik.

  • Fotos und Videos: Dazu gehören Sicherheits-, Überwachungs- und Verkehrsvideos.

  • Radar- oder Sonardaten: Dazu gehören Fahrzeug-, meteorologische und ozeanographische seismische Profile.

Die folgende Liste zeigt einige Beispiele für vom Menschen erzeugte unstrukturierte Daten:

  • Text innerhalb Ihres Unternehmens: Denken Sie an den gesamten Text in Dokumenten, Protokollen, Umfrageergebnissen und E-Mails. Unternehmensinformationen machen heute tatsächlich einen großen Prozentsatz der Textinformationen in der Welt aus.

  • Social Media Daten: Diese Daten werden von den Social Media Plattformen wie YouTube, Facebook, Twitter, LinkedIn und Flickr generiert.

  • Mobile Daten: Dazu gehören Daten wie Textnachrichten und Standortinformationen.

  • Website-Inhalt: Dies kommt von jeder Website, die unstrukturierten Content wie YouTube, Flickr oder Instagram bereitstellt.

Und die Liste geht weiter.

Einige Leute glauben, dass der Begriff unstrukturierte Daten irreführend ist, da jedes Dokument seine eigene spezifische Struktur oder Formatierung enthalten kann, basierend auf der Software, die es erstellt hat. Was jedoch im Dokument intern ist, ist wirklich unstrukturiert.

Bei weitem sind unstrukturierte Daten der größte Teil der Datengleichung, und die Anwendungsfälle für unstrukturierte Daten nehmen schnell zu. Auf der Textseite allein kann die Textanalyse verwendet werden, um unstrukturierten Text zu analysieren und relevante Daten zu extrahieren und diese Daten in strukturierte Informationen umzuwandeln, die auf verschiedene Weise verwendet werden können.

Ein populärer Big-Data-Use-Fall ist zum Beispiel die Social-Media-Analyse zur Verwendung bei Kundengesprächen mit hohem Volumen. Darüber hinaus werden unstrukturierte Daten aus Call-Center-Notizen, E-Mails, schriftlichen Kommentaren in einer Umfrage und anderen Dokumenten analysiert, um das Kundenverhalten zu verstehen. Dies kann mit sozialen Medien aus mehreren Millionen Quellen kombiniert werden, um die Kundenerfahrung zu verstehen.

Die Rolle eines CMS im Big Data Management

Organisationen speichern einige unstrukturierte Daten in Datenbanken. Sie verwenden jedoch auch Enterprise Content Management Systeme (CMS), die den gesamten Lebenszyklus von Inhalten verwalten können. Dies kann Webinhalte, Dokumentinhalte und andere Formularmedien umfassen.

Laut der Vereinigung für Informations- und Bildmanagement (AIIM), einer gemeinnützigen Organisation, die Bildung, Forschung und Best Practices anbietet, umfasst Enterprise Content Management (ECM) die Strategien, Methoden und Tools zur Erfassung, Verwaltung, Inhalte und Dokumente zu organisatorischen Prozessen speichern, aufbewahren und bereitstellen. "Die in ECM enthaltenen Technologien umfassen Dokumentenverwaltung, Records Management, Imaging, Workflow Management, Web Content Management und Collaboration.

Eine ganze Branche ist mit der Verwaltung von Inhalten aufgewachsen, und viele Content-Management-Anbieter erweitern ihre Lösungen, um große Mengen unstrukturierter Daten zu verarbeiten. Es werden jedoch auch neue Technologien entwickelt, um unstrukturierte Daten und die Analyse unstrukturierter Daten zu unterstützen. Einige von diesen unterstützen sowohl strukturierte als auch unstrukturierte Daten. Einige unterstützen Echtzeit-Streams. Dazu gehören Technologien wie Hadoop, MapReduce und Streaming.

Systeme, die Inhalte in Form von Content-Management-Systemen speichern sollen, sind keine eigenständigen Lösungen mehr. Vielmehr sind sie wahrscheinlich Teil einer umfassenden Datenverwaltungslösung. Beispielsweise kann Ihre Organisation Twitter-Feeds überwachen, die dann programmgesteuert eine CMS-Suche auslösen können.

Jetzt erhält die Person, die den Tweet ausgelöst hat, eine Antwort zurück, die einen Ort bietet, an dem der Nutzer das Produkt finden kann, nach dem er oder sie suchen könnte. Der größte Vorteil ist, wenn diese Art von Interaktion in Echtzeit stattfinden kann. Es veranschaulicht auch den Wert der Nutzung von unstrukturierten, strukturierten Echtzeitdaten (Kundendaten über die Person, die getwittert hat) und semi-strukturierten Daten (der eigentliche Inhalt in den CMS-Daten).

Die Realität ist, dass Sie wahrscheinlich einen hybriden Ansatz verwenden werden, um Ihre Big Data-Probleme zu lösen. Beispielsweise ist es nicht sinnvoll, alle Nachrichteninhalte in Hadoop in Ihren Räumlichkeiten zu speichern, da dies die Verwaltung unstrukturierter Daten erleichtern soll.

Unstrukturierte Daten in einer Big Data-Umgebung - Dummies

Die Wahl des Herausgebers

Wie man Dateien in C ++ kopiert - Dummies

Wie man Dateien in C ++ kopiert - Dummies

Ah, eine Datei kopieren - etwas so einfaches, es passiert alles Zeit. Kopiere diese Datei dorthin; Kopieren Sie diese Datei hier. Aber was genau passiert, wenn Sie eine Datei kopieren? Sie erstellen tatsächlich eine neue Datei und füllen diese mit dem gleichen Inhalt wie die Originaldatei. Und wie machst du das? Nun, ...

Anleitung zum Erstellen eines Verzeichnisses in C ++ - Dummies

Anleitung zum Erstellen eines Verzeichnisses in C ++ - Dummies

Wenn Sie ein Verzeichnis erstellen möchten, können Sie das MKdir Funktion. Wenn die Funktion das Verzeichnis für Sie erstellen kann, gibt sie eine 0 zurück. Andernfalls wird ein Wert ungleich Null zurückgegeben. (Wenn Sie es ausführen, erhalten Sie eine -1, aber Ihre beste Wette - immer - ist es, gegen 0 zu testen.) Hier ist einige ...

Wie man eine einfache mathematische Vorlage in C ++ - Dummies

Wie man eine einfache mathematische Vorlage in C ++ - Dummies

Mit einer mathematischen Vorlage erstellt, die man normalerweise benötigt Zugriff auf eine Vielzahl von Berechnungen, aber nur jeweils eine oder zwei dieser Berechnungen. Zum Beispiel, wenn jemand Ihre Hypothek berechnet, muss er die Amortisationsrechnung nicht kennen. Die Person kann jedoch die Amortisationsberechnung benötigen, wenn Sie mit ...

Die Wahl des Herausgebers

ASVAB: Lesen für die Studie - Dummies

ASVAB: Lesen für die Studie - Dummies

Lesen für die Zwecke des Studiums der ASVAB ist eine andere Art des Lesens. Leseverständnis erfordert nur, dass Sie Informationen lange genug im Kurzzeitgedächtnis speichern, um einige Sekunden später eine Frage zu beantworten. Zum Lesen für die Zwecke des Studiums müssen Sie wichtige Informationen in Ihr Langzeitgedächtnis einpflegen - ...

ASVAB Mathematik Wissenspraxis: Ungleichungen - Dummies

ASVAB Mathematik Wissenspraxis: Ungleichungen - Dummies

Als wäre Algebra nicht anspruchsvoll genug, einige Fragen zur Der Subtest Mathematik auf dem ASVAB wird auch eine Ungleichheit einwerfen - nur um sicherzustellen, dass Sie aufmerksam sind. Wie erkennst du eine Ungleichheit? Halten Sie Ausschau nach Fragen mit mehr als oder weniger als Symbolen oder nach Graphen, die eine Zahlenlinie mit einem ...

ASVAB Mathematische Wissenspraxis: Fraktionen - Dummies

ASVAB Mathematische Wissenspraxis: Fraktionen - Dummies

Der Subtest Mathematikwissen auf dem ASVAB wird Fragen beinhalten, die Sie fragen mit Teilen eines Ganzen oder Fraktionen arbeiten. Diese Fragen können das Multiplizieren, Dividieren, Addieren, Subtrahieren und Konvertieren von Brüchen beinhalten, ähnlich den folgenden Übungsfragen. Übungsfragen Welche Fraktionen sind nicht gleichwertig? Gegeben einfach den Ausdruck. Antworten und Erklärungen Das richtige ...

Die Wahl des Herausgebers

Hinzufügen von Flash-Audio- und Videodateien in Dreamweaver - Dummies

Hinzufügen von Flash-Audio- und Videodateien in Dreamweaver - Dummies

Adobe besitzt sowohl Flash als auch Dreamweaver Daher finden Sie großartige Unterstützung für Flash-Dateien in Dreamweaver. Das Dialogfeld "FLV einfügen" erleichtert das Festlegen von Parametern für Flash. Dreamweaver erkennt sogar automatisch die Größe von Flash-Videodateien. Sie können Flash auch zum Erstellen und Einfügen von Audiodateien verwenden, wobei nur der Player angezeigt wird.

Einstellen von Bildhelligkeit und -kontrast in Dreamweaver - Dummies

Einstellen von Bildhelligkeit und -kontrast in Dreamweaver - Dummies

Dreamweaver bietet Werkzeuge zum Erstellen von Bildern Einstellungen, einschließlich der Helligkeit und des Kontrastes. Durch die Anpassung der Bildhelligkeit können Sie die Gesamtlichtmenge in einem Bild ändern. Kontrast steuert den Unterschied zwischen hellen und dunklen Bereichen eines Bildes. Wenn Sie die Dreamweaver-Bearbeitungswerkzeuge verwenden, wird das Bild dauerhaft geändert, wenn die Seite ...

Hinzufügen von Bildern zu Ihrer Website in Dreamweaver - Dummies

Hinzufügen von Bildern zu Ihrer Website in Dreamweaver - Dummies

Wenn Sie Ihrer Website ein Bild hinzufügen, erscheint anfangs fast magisch, weil der Prozess mit Dreamweaver so einfach ist. Die Herausforderung bei Webgrafiken besteht darin, sie nicht zu Ihren Seiten hinzuzufügen, sondern gut aussehende Bilder zu erstellen, die schnell im Browser Ihres Viewers geladen werden. Sie benötigen ein anderes Programm wie Photoshop, Photoshop Elements oder Fireworks, um ...