Zuhause Persönliche Finanzen Visualisierung von Predictive Analysis' Rohdaten - Dummies

Visualisierung von Predictive Analysis' Rohdaten - Dummies

Inhaltsverzeichnis:

Video: SAP S/4HANA + SAP Leonardo: Predictive Analytics for Stock In Transit 2024

Video: SAP S/4HANA + SAP Leonardo: Predictive Analytics for Stock In Transit 2024
Anonim

Ein Bild sagt mehr als tausend Worte - vor allem, wenn Sie versuchen, Ihre Vorhersageanalysedaten in den Griff zu bekommen. Beim Vorbereitungsschritt, während Sie Ihre Daten vorbereiten, ist es eine gängige Praxis, sich vorzustellen, was Sie in der Hand haben, bevor Sie mit dem nächsten Schritt fortfahren.

Sie beginnen mit einer Tabellenkalkulation wie Microsoft Excel, um eine Datenmatrix zu erstellen, die aus Kandidatendaten Features (auch als Attribute bezeichnet) besteht. Verschiedene Business Intelligence-Softwarepakete (z. B. Tableau) können Ihnen einen ersten Überblick über die Daten geben, auf die Sie Analytics anwenden möchten.

Verwendung tabellarischer Visualisierungen für die prädiktive Analyse

Tabellen sind die einfachste und grundlegendste bildliche Darstellung von Daten. Tabellen (auch als Tabellenkalkulation bezeichnet) bestehen aus Zeilen und Spalten - die jeweils den Objekten und ihren Attributen entsprechen, die zuvor als Daten erstellt wurden. Betrachten Sie zum Beispiel Online-Social-Network-Daten. Ein Datenobjekt könnte einen Benutzer darstellen. Attribute eines Benutzers (Datenobjekts) können Überschriften von Spalten sein: Geschlecht, Postleitzahl oder Geburtsdatum.

Die Zellen in einer Tabelle repräsentieren Werte. Mit der Visualisierung in Tabellen können Sie leicht fehlende Attributwerte von Datenobjekten erkennen.

Tabellen können auch die Flexibilität bieten, neue Attribute hinzuzufügen, die Kombinationen anderer Attribute sind. Zum Beispiel können Sie in den Daten des sozialen Netzwerks eine weitere Spalte mit dem Namen Age hinzufügen, die leicht als abgeleitetes Attribut aus dem vorhandenen Attribut "Geburtsdatum" berechnet werden kann. Die tabellarischen Daten des sozialen Netzwerks zeigen eine neue Spalte "Alter", die aus einer anderen vorhandenen Spalte (Geburtsdatum) erstellt wurde.

Balkendiagramme für die Vorhersage-Analyse

Balkendiagramme können verwendet werden, um Spitzen oder Anomalien in Ihren Daten zu erkennen. Sie können es für jedes Attribut verwenden, um schnell Minimal- und Maximalwerte abzubilden. Balkendiagramme können auch verwendet werden, um eine Diskussion zur Normalisierung Ihrer Daten zu starten.

Normalisierung ist die Anpassung einiger - oder aller - Attributwerte auf einer Skala, die die Daten besser nutzbar macht. Beispielsweise können Sie leicht erkennen, dass ein Fehler in den Daten vorliegt: Die Altersleiste eines Datensatzes ist negativ. Diese Anomalie wird leichter durch ein Balkendiagramm als durch eine Tabelle von Daten dargestellt.

Grundlagen von Kreisdiagrammen für die prädiktive Analyse

Kreisdiagramme werden hauptsächlich verwendet, um Prozentsätze anzuzeigen. Sie können leicht die Verteilung mehrerer Gegenstände veranschaulichen und die dominanteste hervorheben. Die Rohdaten des sozialen Netzwerks werden entsprechend dem Age-Attribut dargestellt.Beachten Sie, dass das Diagramm nicht nur eine klare Verteilung von Männern gegenüber Frauen zeigt, sondern auch einen wahrscheinlichen Fehler: R als Wert für den Geschlechtstyp, der möglicherweise beim Erfassen der Daten erstellt wurde.

Verwendung von Diagrammen für die prädiktive Analyse

Die Graphentheorie bietet eine Reihe leistungsfähiger Algorithmen, mit denen strukturierte Daten analysiert und als Graph dargestellt werden können. In der Informatik ist ein Graph eine Datenstruktur, eine Art, Daten zu organisieren, die Beziehungen zwischen Paaren von Datenobjekten darstellen. Ein Graph besteht aus zwei Hauptteilen:

  • Eckpunkte, auch bekannt als Knoten

  • Kanten, die Knotenpaare verbinden

Kanten können gerichtet (als Pfeile gezeichnet) werden und Gewichte haben. Sie können entscheiden, eine Kante (Pfeil) zwischen zwei Knoten (Kreisen) zu platzieren - in diesem Fall die Mitglieder des sozialen Netzwerks, die als Freunde mit anderen Mitgliedern verbunden sind:

Die Richtung des Pfeils gibt an, welche "Freunde" zuerst oder die meisten Interaktionen initiiert.

Grundlagen von Wortwolken für die prädiktive Analyse

Betrachten wir eine Liste von Wörtern oder Begriffen, die als -Wolkenwolke angeordnet sind - eine grafische Darstellung aller Wörter auf der Liste, wobei die Größe jedes Wortes proportional ist zu einer Metrik, die Sie angeben. Wenn Sie beispielsweise eine Tabelle mit Wörtern und Vorkommnissen haben und die wichtigsten Wörter identifizieren möchten, versuchen Sie es mit einer Wortwolke.

Word-Wolken funktionieren, weil die Daten der meisten Organisationen Text sind. Ein gängiges Beispiel ist die Verwendung von Trending Terms durch Twitter. Jeder Begriff in dieser Darstellung hat ein Gewicht, das seine Größe als Indikator für seine relative Bedeutung beeinflusst.

Eine Möglichkeit, diese Gewichtung zu definieren, könnte darin bestehen, wie oft ein Wort in Ihrer Datenerfassung erscheint. Je häufiger ein Wort erscheint, desto "schwerer" ist sein Gewicht - und desto größer erscheint es in der Wolke.

Verwendung von Vogelbeflockung für Vorhersagevorhersagen

Natürliches Beflockungsverhalten ist ein sich selbst organisierendes System, in dem Objekte (insbesondere Lebewesen) sich gemäß (a) der Umgebung, zu der sie gehören, und (b) ihre Antworten auf andere bestehende Objekte. Das Beflockungsverhalten natürlicher Gesellschaften wie Bienen, Fliegen, Vögeln, Fischen und Ameisen - oder auch Menschen - wird auch als Schwarmintelligenz bezeichnet.

Vögel folgen natürlichen Regeln, wenn sie sich wie eine Herde verhalten. Flock-Mates sind Vögel, die sich in einem bestimmten Abstand voneinander befinden; diese Vögel gelten als ähnlich. Jeder Vogel bewegt sich nach den drei Hauptregeln, die das Beflockungsverhalten organisieren.

  • Trennung: Herde dürfen nicht miteinander kollidieren.

  • Ausrichtung: Schwarmkameraden bewegen sich in der gleichen Durchschnittsrichtung wie ihre Nachbarn.

  • Kohäsion: Die Herde der Herde bewegt sich entsprechend der durchschnittlichen Position oder Position ihrer Herde.

Die Modellierung dieser drei Regeln kann es einem Analysesystem ermöglichen, Beflockungsverhalten zu simulieren. Mithilfe des selbstorganisierten natürlichen Verhaltens von Vogelbeflockungen können Sie eine einfache Kalkulationstabelle in eine Visualisierung konvertieren.Der Schlüssel ist, den Begriff der Ähnlichkeit als Teil Ihrer Daten zu definieren. Beginnen Sie mit ein paar Fragen:

  • Was macht zwei Datenobjekte in Ihren Daten ähnlich?

  • Welche Attribute können die Ähnlichkeit zwischen zwei Datensätzen am besten beeinflussen?

Zum Beispiel repräsentieren die Datensätze in Daten des sozialen Netzwerks einzelne Benutzer; die Attribute, die sie beschreiben, können Alter, Postleitzahl, Beziehungsstatus, Liste der Freunde, Anzahl der Freunde, Gewohnheiten, Ereignisse

Visualisierung von Predictive Analysis' Rohdaten - Dummies

Die Wahl des Herausgebers

Netzwerkgrundlagen: IPv6-Adresse Vereinfachte Notation - Dummies

Netzwerkgrundlagen: IPv6-Adresse Vereinfachte Notation - Dummies

Bei der Arbeit mit IPv6-Adressen kann es viel Zeit in Anspruch nehmen. schreibe deine Adressen - immerhin sind sie 128 Bit lang. Um das Leben einfacher zu machen, gibt es einige Regeln, die Sie verwenden können, um diese Schreibweise zu verdichten: Führende Nullen in der Adresse sind optional. Für einen Adressblock wäre also 0A45 gleich A45, ...

Netzwerkgrundlagen: IP-Netzwerkklassen - Dummies

Netzwerkgrundlagen: IP-Netzwerkklassen - Dummies

Netzwerkadressierungsarchitektur unterteilt den Adressraum für Internet Protocol Version 4 (IPv4 ) in fünf Adressklassen. Jede Klasse, die in den ersten vier Bits der Adresse codiert ist, definiert entweder eine andere Netzwerkgröße, d.h. e. Anzahl der Hosts für Unicast-Adressen (Klassen A, B, C) oder Multicast-Netzwerk (Klasse D). Die fünfte Klasse (E) address ...

Netzwerkgrundlagen: Netzwerkport Übersicht - Dummys

Netzwerkgrundlagen: Netzwerkport Übersicht - Dummys

In TCP / IP- und UDP-Netzwerken ist ein Port ein Endpunkt eine logische Verbindung. Die Portnummer gibt an, um welchen Port es sich handelt. Port 80 wird beispielsweise für HTTP-Datenverkehr verwendet. Wenn Sie einen Befehl wie netstat -n unter Microsoft Windows oder Linux verwenden, sehen Sie eine Auflistung der lokalen Adressen ...

Die Wahl des Herausgebers

Excel-Dashboards: Wie Sie Ihr erstes Makro aufzeichnen - Dummies

Excel-Dashboards: Wie Sie Ihr erstes Makro aufzeichnen - Dummies

Wenn Sie ein Anfänger auf dem Dashboard sind Automatisierung in Excel ist es unwahrscheinlich, dass Sie den VBA-Code (Visual Basic für Applikationen) von Hand schreiben können, um Makros zu erstellen. Ohne vollständige Kenntnis des Objektmodells und der Syntax von Excel wäre das Schreiben des benötigten Codes für die meisten Anfänger unmöglich. Hier können Sie ein Makro aufzeichnen ...

Excel-Formelberechnungsmodi - Dummys

Excel-Formelberechnungsmodi - Dummys

Standardmäßig ist Excel so eingestellt, dass es automatisch neu berechnet wird. Wenn Sie eine der Zellen ändern, auf die in einer bestimmten Formel verwiesen wird, berechnet Excel diese Formel automatisch neu, sodass ein korrektes Ergebnis basierend auf den Änderungen in den Zellbezügen zurückgegeben wird. Wenn die Formel, die neu berechnet wird, auch als Zellenreferenz in anderen verwendet wird ...

Excel Formelfehler - Dummies

Excel Formelfehler - Dummies

Es ist nicht immer glatt, wenn Sie mit Excel-Formeln arbeiten. Manchmal gibt eine Formel einen Fehlerwert anstelle des erwarteten Werts zurück. Excel hilft Ihnen, das Problem zu identifizieren, indem Sie einen von sieben Fehlerwerten zurückgeben: # DIV / 0! , # N / A, #NAME? , #NULL! , #NUM! , #REF! und #WERT! , erklärt in der folgenden Liste: # DIV / 0! : ...

Die Wahl des Herausgebers

Teilen, Weiterverbreiten und Kommentieren von Google+ Posts - Dummies

Teilen, Weiterverbreiten und Kommentieren von Google+ Posts - Dummies

, Wenn Sie mit der Verwendung und Veröffentlichung beginnen Bei Google+ möchten Sie gelegentlich Links und Bilder teilen, die Beiträge anderer freigeben, ihre Beiträge kommentieren und andere in Ihren eigenen Google+ Beiträgen erwähnen. Vielleicht fragen Sie sich auch, wie Sie andere dazu bringen, Ihre eigenen Beiträge öfter zu kommentieren. Teilen von Links und Bildern in Google+ So geben Sie ein ...

Teilen Ihrer Google+ Posts mit bestimmten Personen - Dummies

Teilen Ihrer Google+ Posts mit bestimmten Personen - Dummies

Beiträge auf Google+ sind ganz einfach und können posten Text, Links, Fotos, Videos und sogar Ihren aktuellen Standort. Der schwierigste Teil des Beitrags auf Google+ besteht darin, auszuwählen, wen Sie Ihren Beitrag sehen möchten. Google+ verwendet Ihre Kreise, um festzulegen, wer Ihre Beiträge sehen kann. Kreise sind etwas einfacher als Listen, weil ...

Taggen von Personen in Google+ Fotos - Dummies

Taggen von Personen in Google+ Fotos - Dummies

Sie können Personen in Ihren Kreisen auf jedem Foto auf Google+ markieren. Wenn Sie eine Person in einem Foto taggen, wird diese Person über ihre Google+ Benachrichtigungen benachrichtigt. Sie können dann das Tag entfernen oder genehmigen, und das Foto wird mit dem Tag des Namens dieser Person darin angezeigt. Um jemanden zu markieren, ...