Video: Überblick Sortierverfahren 1 ● Gehe auf SIMPLECLUB.DE/GO & werde #EinserSchüler 2024
Die menschliche Rasse befindet sich heute an einem unglaublichen Schnittpunkt beispielloser Datenmengen, die von immer kleinerer und leistungsstärkerer Hardware generiert und durch Algorithmen analysiert werden, Prozess half bei der Entwicklung. Es ist nicht nur eine Frage des Volumens, was selbst eine schwierige Herausforderung ist.
Wie 2001 von der Forschungsfirma Gartner formalisiert und dann von anderen Unternehmen wie IBM repremiert und erweitert, lassen sich Big Data mit vier V zusammenfassen, die ihre wichtigsten Eigenschaften repräsentieren:
- Volume: Die Datenmenge
- Velocity: Die Geschwindigkeit der Datengenerierung
- Variety: Die Anzahl und Arten der Datenquellen
- Veracity: Die Qualität und autoritative Stimme der Daten (Quantifizierung von Fehlern, schlechten Daten und mit Signalen gemischtem Rauschen), ein Maß für die Unsicherheit der Daten
Jedes Big Data-Merkmal bietet eine Herausforderung und eine Chance. Volume berücksichtigt zum Beispiel die Menge an nützlichen Daten. Was eine Organisation für Big Data hält, könnten kleine Daten für eine andere sein. Die Unfähigkeit, die Daten auf einem einzelnen Rechner zu verarbeiten, macht die Daten nicht groß. Was Big Data von den Business-as-usual-Daten unterscheidet, ist, dass es eine Organisation zwingt, ihre vorherrschenden Methoden und Lösungen zu überarbeiten und gegenwärtige Technologien und Algorithmen nach vorne zu schieben.
Variety ermöglicht die Verwendung von Big Data, um die wissenschaftliche Methode in Frage zu stellen, wie durch diesen Meilenstein und viel diskutierten Artikel von Chris Anderson, Chefredakteur Wired, erklärt. zu der Zeit, wie große Datenmengen wissenschaftliche Entdeckungen außerhalb der wissenschaftlichen Methode unterstützen können. Der Autor stützt sich auf das Beispiel von Google im Werbe- und Übersetzungssektor, wo das Unternehmen ohne Verwendung spezieller Modelle oder Theorien prominenter werden könnte, aber durch die Anwendung von Algorithmen, um aus Daten zu lernen. Wie in der Werbung können Daten aus der Wissenschaft (Physik, Biologie) Innovationen unterstützen, die es Wissenschaftlern ermöglichen, Probleme ohne Hypothesen anzugehen, aber die in großen Datenmengen gefundenen Variationen und Entdeckungsalgorithmen zu berücksichtigen.
Die Echtheitskennlinie hilft bei der Demokratisierung von Daten selbst. In der Vergangenheit horten Organisationen Daten, weil sie kostbar und schwer zu beschaffen waren. Zu diesem Zeitpunkt erzeugen verschiedene Quellen Daten in solch wachsenden Mengen, dass das Horten sie bedeutungslos ist (90 Prozent der weltweiten Daten wurden in den letzten zwei Jahren erstellt), so dass es keinen Grund gibt, den Zugang zu begrenzen. Daten werden zu einer solchen Ware, dass es viele offene Datenprogramme gibt, die rund um die Welt gehen.(Die Vereinigten Staaten haben eine lange Tradition des offenen Zugangs; die ersten offenen Datenprogramme gehen auf die 1970er Jahre zurück, als die Nationale Ozean- und Atmosphärenverwaltung, NOAA, begann, Wetterdaten frei an die Öffentlichkeit zu bringen.) Da Daten jedoch zu einer Ware geworden sind Die Unsicherheit dieser Daten ist zu einem Problem geworden. Sie wissen nicht mehr, ob die Daten vollständig wahr sind, weil Sie vielleicht nicht einmal wissen, woher sie stammen.
Daten sind so allgegenwärtig geworden, dass ihr Wert nicht mehr in den tatsächlichen Informationen enthalten ist (wie z. B. Daten, die in der Datenbank eines Unternehmens gespeichert sind). Der Wert von Daten ist in der Verwendung vorhanden. Hier kommen Algorithmen ins Spiel und verändern das Spiel. Ein Unternehmen wie Google füttert sich aus frei verfügbaren Daten wie dem Inhalt von Webseiten oder dem Text aus öffentlich zugänglichen Texten und Büchern. Der Wert, den Google aus den Daten extrahiert, leitet sich jedoch hauptsächlich von seinen Algorithmen ab. Der Datenwert befindet sich beispielsweise im PageRank-Algorithmus (siehe Kapitel 11), der die Grundlage von Google darstellt. Der Wert von Algorithmen gilt auch für andere Unternehmen. Die Recommendation Engine von Amazon trägt einen bedeutenden Teil der Einnahmen des Unternehmens bei. Viele Finanzunternehmen nutzen algorithmischen Handel und Robo-Beratung, indem sie frei verfügbare Bestandsdaten und Wirtschaftsinformationen für Investitionen nutzen.