Video: How to make a Scatter Graph 2024
Der erste Schritt zur Vorhersagemodellierung besteht darin, Variablen miteinander in Beziehung zu setzen. Ein einfaches, bemerkenswertes Werkzeug dafür ist das Scatterplot. Es wird verwendet, um einen kontinuierlichen Messwert mit einem anderen zu verknüpfen. Data Miner dehnen die Regeln manchmal aus und verwenden sie auch mit kategorialen Variablen.
Die horizontale ( x ) Achse des Diagramms repräsentiert Werte einer Variablen; die vertikale Achse ( y ) repräsentiert eine zweite Variable. Sie haben möglicherweise keine Vorstellung davon, welche Variable unabhängig ist und welche Abhängigkeit für jedes Variablenpaar besteht.
Wenn Sie dies tun, sollte die unabhängige Variable auf der horizontalen Achse liegen. Jeder Punkt auf der Zeichnung repräsentiert die Koordinaten, das Wertepaar für die beiden Variablen innerhalb eines einzelnen Falls. (Diese Paare werden manchmal xy-Paare genannt).
Finden Sie Ihr Streudiagramm-Werkzeug und richten Sie ein einfaches Streudiagramm-Werkzeug ein, indem Sie zwei zu verwendende Variablen auswählen. Die folgende Abbildung zeigt dieses Werkzeug im Menü von Orange. Der Ort für das Werkzeug ist je nach Produkt unterschiedlich.
Das Beispiel im nächsten Bild zeigt eine interaktive Anzeige. Das Streudiagramm erscheint sofort. In einem anderen Tool benötigen Sie möglicherweise zusätzliche Schritte zum Ausführen und Erstellen des Diagramms.
Das Streudiagramm-Beispiel bezieht sich auf die Autokilometerleistung auf die Motorleistung. Geringe PS sind mit hohen Laufleistungen verbunden, und je höher die Leistung, desto geringer die Laufleistung. Sie können dieses Muster leicht in den Daten sehen. Sie können eine Form bemerken, nicht linear, sondern etwas gekrümmt. Dies könnte Hinweise darauf geben, welche Modelltypen später zu probieren sind.
Data-Mining-Anwendungen verfügen häufig über einige interaktive Funktionen in Diagrammdarstellungen. Zum Beispiel zeigt die nächste Abbildung, dass das Bewegen der Maus über einen Punkt die exakten Werte der beiden Variablen für diesen Punkt anzeigt. Das ist einfacher als zu versuchen, die Werte von den Achsen zu lesen!