Video: Data Mining mit Orange 2024
Data Miner arbeiten schnell. Um schnell zu werden, müssen Sie geeignete Tools verwenden und die Tricks des Handels entdecken. Ihr bestes Data-Mining-Tool ist Ihr Gehirn mit ein wenig Know-how. Das zweitbeste Tool ist eine Data-Mining-Anwendung mit einer visuellen Programmierschnittstelle.
Bei der visuellen Programmierung werden die Schritte in Ihrem Arbeitsprozess durch kleine Bilder dargestellt, die Sie auf dem Bildschirm organisieren, um ein Bild des Ablaufs und der Logik Ihrer Arbeit zu erstellen. Die visuelle Programmierung macht es einfacher zu sehen, was Sie über mehrere Schritte tun als mit Befehlen (Programmierung) oder herkömmlichen Menüs.
In diesem Beispiel sehen Sie den Arbeitsprozess im Hauptbereich der Data-Mining-Anwendung. Darin befinden sich Menüs für aktuelle Projekte, Tools für Data-Mining-Funktionen, ein Viewer für die Navigation durch komplexe Prozesse und ein Protokoll. Diese Details variieren ein wenig von einem Produkt zum anderen.
Schauen Sie sich den Prozess genauer an. Obwohl Sie sich gerade auf den Weg machen, ein Data Miner zu sein, können Sie wahrscheinlich vieles verstehen, wenn Sie sich dieses Diagramm ansehen, einschließlich der folgenden:
-
Sie können den CSV-Reader sehen. Wenn Sie sich bewusst sind. csv (comma-separated values) Datenformat, wissen Sie wahrscheinlich bereits, dass dies der Datenimport ist. (Und es ist der erste Schritt; Sie brauchen Daten, um etwas anderes zu tun.)
-
Dann sehen Sie Werkzeuge, die eindeutig durch Funktionen wie Spaltenumbenennung und Zeichenfolgenmanipulation beschriftet sind. Dies sind Datenvorbereitungsschritte.
-
Tree Learner kann mysteriös sein, wenn Sie neu in der Modellierung sind, aber dieses Tool erstellt ein Entscheidungsbaum -Modell aus einer Teilmenge der Daten.
-
In den letzten Schritten wird das Modell auf Daten angewendet, die zum Testen separat aufbewahrt wurden, und es werden einige Evaluierungstechniken durchgeführt.