Inhaltsverzeichnis:
- Verwendung tabellarischer Visualisierungen für die prädiktive Analyse
- Balkendiagramme für die Vorhersage-Analyse
- Grundlagen von Kreisdiagrammen für die prädiktive Analyse
- Verwendung von Diagrammen für die prädiktive Analyse
- Grundlagen von Wortwolken für die prädiktive Analyse
- Verwendung von Vogelbeflockung für Vorhersagevorhersagen
Video: SAP S/4HANA + SAP Leonardo: Predictive Analytics for Stock In Transit 2024
Ein Bild sagt mehr als tausend Worte - vor allem, wenn Sie versuchen, Ihre Vorhersageanalysedaten in den Griff zu bekommen. Beim Vorbereitungsschritt, während Sie Ihre Daten vorbereiten, ist es eine gängige Praxis, sich vorzustellen, was Sie in der Hand haben, bevor Sie mit dem nächsten Schritt fortfahren.
Sie beginnen mit einer Tabellenkalkulation wie Microsoft Excel, um eine Datenmatrix zu erstellen, die aus Kandidatendaten Features (auch als Attribute bezeichnet) besteht. Verschiedene Business Intelligence-Softwarepakete (z. B. Tableau) können Ihnen einen ersten Überblick über die Daten geben, auf die Sie Analytics anwenden möchten.
Verwendung tabellarischer Visualisierungen für die prädiktive Analyse
Tabellen sind die einfachste und grundlegendste bildliche Darstellung von Daten. Tabellen (auch als Tabellenkalkulation bezeichnet) bestehen aus Zeilen und Spalten - die jeweils den Objekten und ihren Attributen entsprechen, die zuvor als Daten erstellt wurden. Betrachten Sie zum Beispiel Online-Social-Network-Daten. Ein Datenobjekt könnte einen Benutzer darstellen. Attribute eines Benutzers (Datenobjekts) können Überschriften von Spalten sein: Geschlecht, Postleitzahl oder Geburtsdatum.
Die Zellen in einer Tabelle repräsentieren Werte. Mit der Visualisierung in Tabellen können Sie leicht fehlende Attributwerte von Datenobjekten erkennen.
Tabellen können auch die Flexibilität bieten, neue Attribute hinzuzufügen, die Kombinationen anderer Attribute sind. Zum Beispiel können Sie in den Daten des sozialen Netzwerks eine weitere Spalte mit dem Namen Age hinzufügen, die leicht als abgeleitetes Attribut aus dem vorhandenen Attribut "Geburtsdatum" berechnet werden kann. Die tabellarischen Daten des sozialen Netzwerks zeigen eine neue Spalte "Alter", die aus einer anderen vorhandenen Spalte (Geburtsdatum) erstellt wurde.
Balkendiagramme für die Vorhersage-Analyse
Balkendiagramme können verwendet werden, um Spitzen oder Anomalien in Ihren Daten zu erkennen. Sie können es für jedes Attribut verwenden, um schnell Minimal- und Maximalwerte abzubilden. Balkendiagramme können auch verwendet werden, um eine Diskussion zur Normalisierung Ihrer Daten zu starten.
Normalisierung ist die Anpassung einiger - oder aller - Attributwerte auf einer Skala, die die Daten besser nutzbar macht. Beispielsweise können Sie leicht erkennen, dass ein Fehler in den Daten vorliegt: Die Altersleiste eines Datensatzes ist negativ. Diese Anomalie wird leichter durch ein Balkendiagramm als durch eine Tabelle von Daten dargestellt.
Grundlagen von Kreisdiagrammen für die prädiktive Analyse
Kreisdiagramme werden hauptsächlich verwendet, um Prozentsätze anzuzeigen. Sie können leicht die Verteilung mehrerer Gegenstände veranschaulichen und die dominanteste hervorheben. Die Rohdaten des sozialen Netzwerks werden entsprechend dem Age-Attribut dargestellt.Beachten Sie, dass das Diagramm nicht nur eine klare Verteilung von Männern gegenüber Frauen zeigt, sondern auch einen wahrscheinlichen Fehler: R als Wert für den Geschlechtstyp, der möglicherweise beim Erfassen der Daten erstellt wurde.
Verwendung von Diagrammen für die prädiktive Analyse
Die Graphentheorie bietet eine Reihe leistungsfähiger Algorithmen, mit denen strukturierte Daten analysiert und als Graph dargestellt werden können. In der Informatik ist ein Graph eine Datenstruktur, eine Art, Daten zu organisieren, die Beziehungen zwischen Paaren von Datenobjekten darstellen. Ein Graph besteht aus zwei Hauptteilen:
-
Eckpunkte, auch bekannt als Knoten
-
Kanten, die Knotenpaare verbinden
Kanten können gerichtet (als Pfeile gezeichnet) werden und Gewichte haben. Sie können entscheiden, eine Kante (Pfeil) zwischen zwei Knoten (Kreisen) zu platzieren - in diesem Fall die Mitglieder des sozialen Netzwerks, die als Freunde mit anderen Mitgliedern verbunden sind:
Die Richtung des Pfeils gibt an, welche "Freunde" zuerst oder die meisten Interaktionen initiiert.
Grundlagen von Wortwolken für die prädiktive Analyse
Betrachten wir eine Liste von Wörtern oder Begriffen, die als -Wolkenwolke angeordnet sind - eine grafische Darstellung aller Wörter auf der Liste, wobei die Größe jedes Wortes proportional ist zu einer Metrik, die Sie angeben. Wenn Sie beispielsweise eine Tabelle mit Wörtern und Vorkommnissen haben und die wichtigsten Wörter identifizieren möchten, versuchen Sie es mit einer Wortwolke.
Word-Wolken funktionieren, weil die Daten der meisten Organisationen Text sind. Ein gängiges Beispiel ist die Verwendung von Trending Terms durch Twitter. Jeder Begriff in dieser Darstellung hat ein Gewicht, das seine Größe als Indikator für seine relative Bedeutung beeinflusst.
Eine Möglichkeit, diese Gewichtung zu definieren, könnte darin bestehen, wie oft ein Wort in Ihrer Datenerfassung erscheint. Je häufiger ein Wort erscheint, desto "schwerer" ist sein Gewicht - und desto größer erscheint es in der Wolke.
Verwendung von Vogelbeflockung für Vorhersagevorhersagen
Natürliches Beflockungsverhalten ist ein sich selbst organisierendes System, in dem Objekte (insbesondere Lebewesen) sich gemäß (a) der Umgebung, zu der sie gehören, und (b) ihre Antworten auf andere bestehende Objekte. Das Beflockungsverhalten natürlicher Gesellschaften wie Bienen, Fliegen, Vögeln, Fischen und Ameisen - oder auch Menschen - wird auch als Schwarmintelligenz bezeichnet.
Vögel folgen natürlichen Regeln, wenn sie sich wie eine Herde verhalten. Flock-Mates sind Vögel, die sich in einem bestimmten Abstand voneinander befinden; diese Vögel gelten als ähnlich. Jeder Vogel bewegt sich nach den drei Hauptregeln, die das Beflockungsverhalten organisieren.
-
Trennung: Herde dürfen nicht miteinander kollidieren.
-
Ausrichtung: Schwarmkameraden bewegen sich in der gleichen Durchschnittsrichtung wie ihre Nachbarn.
-
Kohäsion: Die Herde der Herde bewegt sich entsprechend der durchschnittlichen Position oder Position ihrer Herde.
Die Modellierung dieser drei Regeln kann es einem Analysesystem ermöglichen, Beflockungsverhalten zu simulieren. Mithilfe des selbstorganisierten natürlichen Verhaltens von Vogelbeflockungen können Sie eine einfache Kalkulationstabelle in eine Visualisierung konvertieren.Der Schlüssel ist, den Begriff der Ähnlichkeit als Teil Ihrer Daten zu definieren. Beginnen Sie mit ein paar Fragen:
-
Was macht zwei Datenobjekte in Ihren Daten ähnlich?
-
Welche Attribute können die Ähnlichkeit zwischen zwei Datensätzen am besten beeinflussen?
Zum Beispiel repräsentieren die Datensätze in Daten des sozialen Netzwerks einzelne Benutzer; die Attribute, die sie beschreiben, können Alter, Postleitzahl, Beziehungsstatus, Liste der Freunde, Anzahl der Freunde, Gewohnheiten, Ereignisse