Zuhause Persönliche Finanzen Visualisierung von Predictive Analysis' Rohdaten - Dummies

Visualisierung von Predictive Analysis' Rohdaten - Dummies

Inhaltsverzeichnis:

Video: SAP S/4HANA + SAP Leonardo: Predictive Analytics for Stock In Transit 2025

Video: SAP S/4HANA + SAP Leonardo: Predictive Analytics for Stock In Transit 2025
Anonim

Ein Bild sagt mehr als tausend Worte - vor allem, wenn Sie versuchen, Ihre Vorhersageanalysedaten in den Griff zu bekommen. Beim Vorbereitungsschritt, während Sie Ihre Daten vorbereiten, ist es eine gängige Praxis, sich vorzustellen, was Sie in der Hand haben, bevor Sie mit dem nächsten Schritt fortfahren.

Sie beginnen mit einer Tabellenkalkulation wie Microsoft Excel, um eine Datenmatrix zu erstellen, die aus Kandidatendaten Features (auch als Attribute bezeichnet) besteht. Verschiedene Business Intelligence-Softwarepakete (z. B. Tableau) können Ihnen einen ersten Überblick über die Daten geben, auf die Sie Analytics anwenden möchten.

Verwendung tabellarischer Visualisierungen für die prädiktive Analyse

Tabellen sind die einfachste und grundlegendste bildliche Darstellung von Daten. Tabellen (auch als Tabellenkalkulation bezeichnet) bestehen aus Zeilen und Spalten - die jeweils den Objekten und ihren Attributen entsprechen, die zuvor als Daten erstellt wurden. Betrachten Sie zum Beispiel Online-Social-Network-Daten. Ein Datenobjekt könnte einen Benutzer darstellen. Attribute eines Benutzers (Datenobjekts) können Überschriften von Spalten sein: Geschlecht, Postleitzahl oder Geburtsdatum.

Die Zellen in einer Tabelle repräsentieren Werte. Mit der Visualisierung in Tabellen können Sie leicht fehlende Attributwerte von Datenobjekten erkennen.

Tabellen können auch die Flexibilität bieten, neue Attribute hinzuzufügen, die Kombinationen anderer Attribute sind. Zum Beispiel können Sie in den Daten des sozialen Netzwerks eine weitere Spalte mit dem Namen Age hinzufügen, die leicht als abgeleitetes Attribut aus dem vorhandenen Attribut "Geburtsdatum" berechnet werden kann. Die tabellarischen Daten des sozialen Netzwerks zeigen eine neue Spalte "Alter", die aus einer anderen vorhandenen Spalte (Geburtsdatum) erstellt wurde.

Balkendiagramme für die Vorhersage-Analyse

Balkendiagramme können verwendet werden, um Spitzen oder Anomalien in Ihren Daten zu erkennen. Sie können es für jedes Attribut verwenden, um schnell Minimal- und Maximalwerte abzubilden. Balkendiagramme können auch verwendet werden, um eine Diskussion zur Normalisierung Ihrer Daten zu starten.

Normalisierung ist die Anpassung einiger - oder aller - Attributwerte auf einer Skala, die die Daten besser nutzbar macht. Beispielsweise können Sie leicht erkennen, dass ein Fehler in den Daten vorliegt: Die Altersleiste eines Datensatzes ist negativ. Diese Anomalie wird leichter durch ein Balkendiagramm als durch eine Tabelle von Daten dargestellt.

Grundlagen von Kreisdiagrammen für die prädiktive Analyse

Kreisdiagramme werden hauptsächlich verwendet, um Prozentsätze anzuzeigen. Sie können leicht die Verteilung mehrerer Gegenstände veranschaulichen und die dominanteste hervorheben. Die Rohdaten des sozialen Netzwerks werden entsprechend dem Age-Attribut dargestellt.Beachten Sie, dass das Diagramm nicht nur eine klare Verteilung von Männern gegenüber Frauen zeigt, sondern auch einen wahrscheinlichen Fehler: R als Wert für den Geschlechtstyp, der möglicherweise beim Erfassen der Daten erstellt wurde.

Verwendung von Diagrammen für die prädiktive Analyse

Die Graphentheorie bietet eine Reihe leistungsfähiger Algorithmen, mit denen strukturierte Daten analysiert und als Graph dargestellt werden können. In der Informatik ist ein Graph eine Datenstruktur, eine Art, Daten zu organisieren, die Beziehungen zwischen Paaren von Datenobjekten darstellen. Ein Graph besteht aus zwei Hauptteilen:

  • Eckpunkte, auch bekannt als Knoten

  • Kanten, die Knotenpaare verbinden

Kanten können gerichtet (als Pfeile gezeichnet) werden und Gewichte haben. Sie können entscheiden, eine Kante (Pfeil) zwischen zwei Knoten (Kreisen) zu platzieren - in diesem Fall die Mitglieder des sozialen Netzwerks, die als Freunde mit anderen Mitgliedern verbunden sind:

Die Richtung des Pfeils gibt an, welche "Freunde" zuerst oder die meisten Interaktionen initiiert.

Grundlagen von Wortwolken für die prädiktive Analyse

Betrachten wir eine Liste von Wörtern oder Begriffen, die als -Wolkenwolke angeordnet sind - eine grafische Darstellung aller Wörter auf der Liste, wobei die Größe jedes Wortes proportional ist zu einer Metrik, die Sie angeben. Wenn Sie beispielsweise eine Tabelle mit Wörtern und Vorkommnissen haben und die wichtigsten Wörter identifizieren möchten, versuchen Sie es mit einer Wortwolke.

Word-Wolken funktionieren, weil die Daten der meisten Organisationen Text sind. Ein gängiges Beispiel ist die Verwendung von Trending Terms durch Twitter. Jeder Begriff in dieser Darstellung hat ein Gewicht, das seine Größe als Indikator für seine relative Bedeutung beeinflusst.

Eine Möglichkeit, diese Gewichtung zu definieren, könnte darin bestehen, wie oft ein Wort in Ihrer Datenerfassung erscheint. Je häufiger ein Wort erscheint, desto "schwerer" ist sein Gewicht - und desto größer erscheint es in der Wolke.

Verwendung von Vogelbeflockung für Vorhersagevorhersagen

Natürliches Beflockungsverhalten ist ein sich selbst organisierendes System, in dem Objekte (insbesondere Lebewesen) sich gemäß (a) der Umgebung, zu der sie gehören, und (b) ihre Antworten auf andere bestehende Objekte. Das Beflockungsverhalten natürlicher Gesellschaften wie Bienen, Fliegen, Vögeln, Fischen und Ameisen - oder auch Menschen - wird auch als Schwarmintelligenz bezeichnet.

Vögel folgen natürlichen Regeln, wenn sie sich wie eine Herde verhalten. Flock-Mates sind Vögel, die sich in einem bestimmten Abstand voneinander befinden; diese Vögel gelten als ähnlich. Jeder Vogel bewegt sich nach den drei Hauptregeln, die das Beflockungsverhalten organisieren.

  • Trennung: Herde dürfen nicht miteinander kollidieren.

  • Ausrichtung: Schwarmkameraden bewegen sich in der gleichen Durchschnittsrichtung wie ihre Nachbarn.

  • Kohäsion: Die Herde der Herde bewegt sich entsprechend der durchschnittlichen Position oder Position ihrer Herde.

Die Modellierung dieser drei Regeln kann es einem Analysesystem ermöglichen, Beflockungsverhalten zu simulieren. Mithilfe des selbstorganisierten natürlichen Verhaltens von Vogelbeflockungen können Sie eine einfache Kalkulationstabelle in eine Visualisierung konvertieren.Der Schlüssel ist, den Begriff der Ähnlichkeit als Teil Ihrer Daten zu definieren. Beginnen Sie mit ein paar Fragen:

  • Was macht zwei Datenobjekte in Ihren Daten ähnlich?

  • Welche Attribute können die Ähnlichkeit zwischen zwei Datensätzen am besten beeinflussen?

Zum Beispiel repräsentieren die Datensätze in Daten des sozialen Netzwerks einzelne Benutzer; die Attribute, die sie beschreiben, können Alter, Postleitzahl, Beziehungsstatus, Liste der Freunde, Anzahl der Freunde, Gewohnheiten, Ereignisse

Visualisierung von Predictive Analysis' Rohdaten - Dummies

Die Wahl des Herausgebers

Was Sie über den Makler und die Hauptbeziehung für die Immobilienlizenzprüfung wissen sollten - Dummies

Was Sie über den Makler und die Hauptbeziehung für die Immobilienlizenzprüfung wissen sollten - Dummies

Die Elemente der Verantwortung eines Agenten gegenüber dem Auftraggeber werden in einem Wort zusammengefasst - Treuhänder. Die Immobilienlizenzprüfung wird zweifellos Fragen zu diesen Treuhandpflichten stellen. Treuhänder bedeutet treuer Diener, und ein Agent ist der Treuhänder des Auftraggebers. Der Vertreter vertritt getreu die Interessen des Auftraggebers vor allen anderen ...

Erkennen Miller Analogie Test 1: 3, 2: 4 Analogien - Dummies

Erkennen Miller Analogie Test 1: 3, 2: 4 Analogien - Dummies

The Der Miller Analogies Test (MAT) ist ein standardisierter Test, der normalerweise für die Zulassung von Absolventen verwendet wird. Der Test besteht vollständig aus Analogien. Der Miller Analogies Test verwendet mehrere Analogtypen wie 1: 3, 2: 4. Die Erkennung der Art der verwendeten Analogie spielt eine entscheidende Rolle bei der Auswahl der richtigen Antwort für diese Frage. ...

Erkennen Miller Analogie Test 1: 2, 3: 4 Analogien - Dummies

Erkennen Miller Analogie Test 1: 2, 3: 4 Analogien - Dummies

The Der Miller Analogies Test (MAT) ist ein standardisierter Test, der normalerweise für die Zulassung von Absolventen verwendet wird. Der Test besteht vollständig aus Analogien. Der Miller Analogies Test verwendet mehrere Analogtypen wie 1: 2, 3: 4. Die Erkennung der Art der verwendeten Analogie spielt eine entscheidende Rolle bei der Auswahl der richtigen Antwort für diese Frage. ...

Die Wahl des Herausgebers

Excel-Dashboards und -Berichte: So führen Sie Makros aus - Dummies

Excel-Dashboards und -Berichte: So führen Sie Makros aus - Dummies

Makros sind sehr nützlich für Ihre Excel Dashboards und Berichte. Um Ihre Makros in Aktion zu sehen, wählen Sie den Befehl Makros auf der Registerkarte Entwickler. Das in dieser Abbildung gezeigte Dialogfeld wird angezeigt, in dem Sie das Makro auswählen können, das Sie ausführen möchten. Wählen Sie das AddDataBars-Makro aus, und klicken Sie auf die Schaltfläche Ausführen. Wenn alles gut geht, ...

Excel-Dashboards und Berichte: Halten Sie Ihre Pivot-Tabelle frisch - Dummies

Excel-Dashboards und Berichte: Halten Sie Ihre Pivot-Tabelle frisch - Dummies

So langweilig wie Ihre Pivot-Tabellen Wie es scheint, werden sie schließlich zu den Stars Ihrer Excel-Berichte und Dashboards. Es ist daher wichtig, dass Sie Ihre Pivottabellen frisch und relevant halten. Im Laufe der Zeit können sich Ihre Daten mit neu hinzugefügten Zeilen und Spalten ändern und wachsen. Die Aktion der Aktualisierung Ihrer Pivot-Tabelle mit diesen ...

Excel 2010 Für Dummies Cheat Sheet - Dummies

Excel 2010 Für Dummies Cheat Sheet - Dummies

Auf den ersten Blick kann es schwierig sein, die vielen Menüs zu verstehen , Tabulatoren, Spalten und Zeilen der Excel 2010-Benutzeroberfläche. Dieser Cheat Sheet hilft Ihnen jedoch, Ihren Weg zu navigieren, indem Sie Tastenanschläge für die Bewegung des Zellen-Cursors zu einer neuen Zelle zeigen, einfache Regeln für die Dateneingabe-Etikette, häufige Ursachen einiger ...

Die Wahl des Herausgebers

Verwendung von Web Stats zur Verbesserung Ihrer Website - Dummies

Verwendung von Web Stats zur Verbesserung Ihrer Website - Dummies

Leute mögen nicht langsame Webseiten. Die Verwendung von Webstatistiken kann sicherstellen, dass Sie keine haben. Heutzutage werden wir alle durch schnelle Internetverbindungen verwöhnt, und Forschungsergebnisse zeigen, dass Webnutzer auf eine andere Website klicken, wenn Ihre Website mehr als zwei Sekunden benötigt, um sie zu öffnen. Eine schnellere Site behält mehr Besucher. mit einem langsameren ...

Webhost-Systemsteuerungsoptionen - dummies

Webhost-Systemsteuerungsoptionen - dummies

Sie haben mehrere Optionen für Web gehostete Control Panels. Die beliebteste und offensichtlichste Wahl ist cPanel. cPanel ist aufgrund seiner Balance zwischen Flexibilität und Benutzerfreundlichkeit eine gute Wahl für Bedienfelder. Die Wahl des Bedienfelds ist jedoch eine Frage der persönlichen Vorlieben und Sie müssen eines finden, das am besten passt ...

Zehn Essential Online Web Hosting Ressourcen - Dummies

Zehn Essential Online Web Hosting Ressourcen - Dummies

Bücher sind großartige Referenzen, aber es gibt auch einige wirklich gute Web-Hosting-Ressourcen online verfügbar, um Ihnen zusätzliche Informationen zu geben, wenn Sie nicht finden können, was Sie brauchen. Haben Sie keine Angst, das Internet zu überprüfen. ZeltBlogger. com TentBlogger. com ist im Besitz und geschrieben von John Saddington. Es ist wahrscheinlich die beste Online-Ressource für praktisch alles mit ...