Zuhause Persönliche Finanzen ÄNdern von Business Intelligence-Produkten zur Verarbeitung von Big Data - Dummies

ÄNdern von Business Intelligence-Produkten zur Verarbeitung von Big Data - Dummies

Inhaltsverzeichnis:

Video: Big Data und Advanced Analytics mit Microsoft Azure | Microsoft 2025

Video: Big Data und Advanced Analytics mit Microsoft Azure | Microsoft 2025
Anonim

Traditionelle Business-Intelligence-Produkte wurden ursprünglich nicht für die Verarbeitung großer Datenmengen entwickelt, sodass sie möglicherweise geändert werden müssen. Sie wurden entwickelt, um mit hoch strukturierten, gut verstandenen Daten zu arbeiten, die oft in einem relationalen Datenrepository gespeichert und auf Ihrem Desktop oder Laptop angezeigt werden. Diese traditionelle Business-Intelligence-Analyse wird normalerweise auf Snapshots von Daten und nicht auf die gesamte verfügbare Datenmenge angewendet. Was ist anders bei der Big Data Analyse?

Big Data Data

Big Data besteht aus strukturierten, semi-strukturierten und unstrukturierten Daten. Sie haben oft viel davon und es kann sehr komplex sein. Wenn Sie über die Analyse nachdenken, müssen Sie sich der potenziellen Eigenschaften Ihrer Daten bewusst sein:

  • Sie können von nicht vertrauenswürdigen Quellen stammen. Bei der Big Data-Analyse werden häufig Daten aus verschiedenen Quellen aggregiert. Diese können sowohl interne als auch externe Datenquellen umfassen. Wie vertrauenswürdig sind diese externen Informationsquellen? Zum Beispiel, wie vertrauenswürdig sind Social-Media-Daten wie ein Tweet? Die Informationen können von einer nicht verifizierten Quelle stammen. Die Integrität dieser Daten muss in der Analyse berücksichtigt werden.

  • Es kann schmutzig sein. Schmutzige Daten beziehen sich auf ungenaue, unvollständige oder fehlerhafte Daten. Dies kann das Falschschreiben von Wörtern einschließen; ein Sensor, der kaputt, nicht richtig kalibriert oder in irgendeiner Weise beschädigt ist; oder sogar duplizierte Daten. Datenwissenschaftler diskutieren darüber, wo die Daten bereinigt werden müssen - entweder in der Nähe der Quelle oder in Echtzeit.

    Natürlich sagt eine Denkschule, dass die schmutzigen Daten überhaupt nicht gereinigt werden sollten, weil sie interessante Ausreißer enthalten könnten. Die Bereinigungsstrategie hängt wahrscheinlich von der Quelle und der Art der Daten und dem Ziel Ihrer Analyse ab. Wenn Sie beispielsweise einen Spamfilter entwickeln, besteht das Ziel darin, die fehlerhaften Elemente in den Daten zu erkennen, sodass Sie sie nicht bereinigen möchten.

  • Das Signal-Rausch-Verhältnis kann niedrig sein. Mit anderen Worten, das Signal (nutzbare Information) kann nur ein winziger Prozentsatz der Daten sein; der Lärm ist der Rest. In der Lage zu sein, ein winziges Signal aus verrauschten Daten zu extrahieren, ist ein großer Vorteil von Big-Data-Analysen, aber Sie müssen sich bewusst sein, dass das Signal tatsächlich klein sein kann.

  • Es kann Echtzeit sein. In vielen Fällen versuchen Sie, Echtzeitdatenströme zu analysieren.

Big Data Governance wird ein wichtiger Teil der analytischen Gleichung sein. Unter Business Analytics müssen Verbesserungen an Governance-Lösungen vorgenommen werden, um die Richtigkeit der neuen Datenquellen sicherzustellen, insbesondere, da sie mit vorhandenen vertrauenswürdigen Daten kombiniert werden, die in einem Warehouse gespeichert sind.Datensicherheits- und Datenschutzlösungen müssen ebenfalls verbessert werden, um die Verwaltung und Verwaltung von Big Data zu unterstützen, die in neuen Technologien gespeichert sind.

Analytische Big-Data-Algorithmen

Wenn Sie über Big-Data-Analysen nachdenken, müssen Sie sich darüber im Klaren sein, dass wenn Sie über den Desktop hinaus expandieren, die von Ihnen verwendeten Algorithmen oft refaktorisiert werden müssen, interner Code, ohne seine externe Funktion zu beeinträchtigen. Das Schöne an einer Big-Data-Infrastruktur ist, dass Sie ein Modell ausführen können, das früher Stunden oder Tage in Minuten beanspruchte.

Damit können Sie Hunderte Male auf dem Modell iterieren. Wenn Sie jedoch eine Regression für eine Milliarde Datenzeilen in einer verteilten Umgebung ausführen, müssen Sie die Ressourcenanforderungen berücksichtigen, die sich auf das Datenvolumen und seinen Speicherort im Cluster beziehen. Ihre Algorithmen müssen datenbewusst sein.

Darüber hinaus bieten die Anbieter neue Analysen an, die so konzipiert sind, dass sie in der Nähe der großen Datenquellen platziert werden können, um die vorhandenen Daten zu analysieren. Dieser Ansatz, Analysen näher an den Datenquellen durchzuführen, minimiert die Menge der gespeicherten Daten, indem nur die wertvollen Daten beibehalten werden. Es ermöglicht Ihnen außerdem, die Daten früher zu analysieren, was für die Entscheidungsfindung in Echtzeit entscheidend ist.

Natürlich wird sich die Analytik weiter entwickeln. Beispielsweise benötigen Sie Echtzeit-Visualisierungsfunktionen, um Echtzeitdaten anzuzeigen, die sich kontinuierlich ändern. Wie plotten Sie praktisch eine Milliarde Punkte in einem Diagramm? Oder wie arbeiten Sie mit den prädiktiven Algorithmen, so dass sie schnell genug und tief genug analysieren, um einen ständig wachsenden, komplexen Datensatz zu nutzen? Dies ist ein Bereich der aktiven Forschung.

Unterstützung von Big-Data-Infrastrukturen

Es genügt zu sagen, dass, wenn Sie nach einer Plattform suchen, diese Folgendes erreichen muss:

  • Technologien integrieren: Die Infrastruktur muss neue Big-Data-Technologien mit traditionelle Technologien, um alle Arten von Big Data zu verarbeiten und durch traditionelle Analysen konsumierbar zu machen.

  • Speichern Sie große Mengen unterschiedlicher Daten: Es kann ein unternehmensgeschütztes Hadoop-System erforderlich sein, das große Datenmengen in Ruhe verarbeiten, speichern und verwalten kann, unabhängig davon, ob es strukturiert, halbstrukturiert oder unstrukturiert ist.

  • Prozessdaten in Bewegung: Eine Stream-Computing-Funktion kann erforderlich sein, um Daten in Bewegung zu verarbeiten, die kontinuierlich von Sensoren, intelligenten Geräten, Video, Audio und Protokollen zur Echtzeit-Entscheidungsfindung generiert werden.

  • Warehouse-Daten: Möglicherweise benötigen Sie eine Lösung, die für operative oder tiefe analytische Workloads optimiert ist, um die wachsenden Mengen vertrauenswürdiger Daten zu speichern und zu verwalten.

Und natürlich benötigen Sie die Fähigkeit, die bereits vorhandenen Daten zusammen mit den Ergebnissen der Big Data-Analyse zu integrieren.

ÄNdern von Business Intelligence-Produkten zur Verarbeitung von Big Data - Dummies

Die Wahl des Herausgebers

Auflistung Vereinbarungen über die Immobilienlizenz Prüfung - Dummies

Auflistung Vereinbarungen über die Immobilienlizenz Prüfung - Dummies

Listing-Vereinbarungen werden auf der Immobilien abgedeckt werden Lizenzprüfung. Eine Listungsvereinbarung stellt eine Agenturbeziehung zwischen einem Agenten und einem Grundstücksverkäufer her. Der Vertreter verpflichtet sich, den Verkäufer bei der Vermarktung der Immobilie zu vertreten. Hier sind die Namen und Beschreibungen der vier Arten von Listing-Vereinbarungen in der Reihenfolge, in der sie sind ...

Immobilien-Lizenz-Prüfung: 7 Verwirrende Wortpaare - Dummies

Immobilien-Lizenz-Prüfung: 7 Verwirrende Wortpaare - Dummies

Bevor Sie Ihre Immobilienlizenz nehmen Es ist wichtig, dass Sie den Unterschied zwischen ähnlich klingenden Begriffen verstehen. Die folgenden Immobilienbegriffe sind am häufigsten verwirrt; Holen Sie sich diese auswendig und Sie sind auf dem Weg zu mehr richtigen Antworten. Eigentumswohnung / Genossenschaft: Ein Eigentümer einer Eigentumswohnung besitzt tatsächlich Immobilien. Dieser Besitz ist in der Regel der Luftraum ...

Hypothek Akzeptanz Überlegungen zur Immobilienlizenz Prüfung - Dummies

Hypothek Akzeptanz Überlegungen zur Immobilienlizenz Prüfung - Dummies

Die Immobilienlizenz Prüfung wird Fragen zu Hypotheken und Kreditgebern. Ein primärer Kreditgeber hat zwei Überlegungen, wenn er einen Kredit für den Kauf oder die Refinanzierung von Immobilien vergibt: den Wert der Immobilie und die Fähigkeit des Kreditnehmers, die Schulden zu tilgen. Bei der Überprüfung des Wertes der Immobilie, ...

Die Wahl des Herausgebers

GED Fragen der wissenschaftlichen Praxis: Arbeit, Bewegung und Kraft - Dummies

GED Fragen der wissenschaftlichen Praxis: Arbeit, Bewegung und Kraft - Dummies

Die Gesetze von Physik beeinflusst alle Arten von alltäglichen Aktivitäten, vom Autofahren bis zum Baseballspiel. Es überrascht daher nicht, dass sich einige Fragen zum GED Science-Test mit Konzepten wie Arbeit, Bewegung und Kraft befassen. In den folgenden Übungsfragen müssen Sie sowohl Theorie als auch gesunden Menschenverstand anwenden, um ...

GED Beispielfragen: Argumentieren durch Sprachkunst Lesen von technischen Informationen - Dummies

GED Beispielfragen: Argumentieren durch Sprachkunst Lesen von technischen Informationen - Dummies

Zu den Begründungen Durch die Sprachabteilung der GED können Sie gebeten werden, Fragen zu einer technischen Passage zu beantworten. Dies könnte Anweisungen zur Fertigstellung enthalten, wie die folgenden. Die Fragen in diesem Artikel beziehen sich auf den folgenden Auszug aus Russell Harts Fotografie für Dummies, 2. Auflage (Wiley). Was ist das Geheimnis für ...?

GED Beispielfragen: Kurze wissenschaftliche Antwortfragen - Dummys

GED Beispielfragen: Kurze wissenschaftliche Antwortfragen - Dummys

Irgendwann während des Science-Teils der GEE-Test, werden Sie gebeten, eine kurze Antwort zu verfassen. Sie werden eine Passage erhalten und eine Frage stellen, auf die Sie antworten müssen. Machen Sie Ihre Antwort klar und prägnant. Kurzer Antwortdurchgang Jeder kennt Cheddar-Käse. Leute setzen ...

Die Wahl des Herausgebers

Stärkung des Selbstwertgefühls für Dummies Cheat Sheet (UK Edition) - Dummies

Stärkung des Selbstwertgefühls für Dummies Cheat Sheet (UK Edition) - Dummies

Selbstzweifel und schlechte Selbstwertschätzung scheinen Hand in Hand mit dem Menschsein zu gehen. Selbst wenn Sie im Allgemeinen gesund und ein gutes Selbstwertgefühl haben, haben Sie wahrscheinlich Zeiten in Ihrem Leben, an denen Sie sich unwohl fühlen und Gedanken und Gedanken über sich selbst verunglimpfen. Um zu helfen, halten Sie diesen Spickzettel, damit Sie ein paar Tipps und Hinweise haben ...

Antipsychotika und die Behandlung der bipolaren Störung - Dummies

Antipsychotika und die Behandlung der bipolaren Störung - Dummies

Atypische Antipsychotika (atypische Neuroleptika oder Antipsychotika der zweiten Generation) ursprünglich formuliert, um Psychose bei Schizophrenie zu behandeln, aber diese Klasse von Medikamenten hat sich auch als wirksam bei der Verringerung der Manie und Augmentierung Antidepressiva Behandlung erwiesen. Die atypische oder zweite Generation stammt aus der Tatsache, dass diese neuere Art von Antipsychotika anders funktioniert als der ältere Standard oder Neuroleptika der ersten Generation, ...

Verwaltung von Angst mit Achtsamkeit für Dummies Cheat Sheet - Dummies

Verwaltung von Angst mit Achtsamkeit für Dummies Cheat Sheet - Dummies

Sie möchten mehr darüber erfahren, wie Sie Ihre Angst mit Achtsamkeit? Sieh dir den Spickzettel an und entdecke die häufigsten Ursachen von Angstzuständen. Versuchen Sie eine kurze Achtsamkeitsübung, die Ihrer Angst helfen kann. Erkunde Wege, wie du deine ängstlichen Gedanken achtsam handhaben kannst. Finden Sie einfache Möglichkeiten heraus, jeden Tag aufmerksam zu sein. Dieser Spickzettel ...