Video: Festplatte auf Ebay mit 14.365 privaten Fotos gekauft - Wie löscht man eine Festplatte richtig 2024
Menschen benutzen Erfahrung, wenn sie die Daten, die sie sehen, interpretieren, Computer jedoch nicht. Ihre Data-Mining-Software wird ihr Bestes geben, um die Art der Daten in jeder Spalte zu ermitteln. Die Datentypen sind jedoch häufig nicht eindeutig.
Wenn Sie eine Liste von Postleitzahlen sehen, versuchen Sie nicht, sie hinzuzufügen und zu subtrahieren. Sie wissen, dass sie Orte darstellen. Sie verstehen das, weil Sie viel Erfahrung damit haben, Postleitzahlen zu sehen und zu erkennen. Ein Computer interpretiert eine Postleitzahl möglicherweise als Ganzzahl oder kontinuierliche Kennzahl. Am Ende ist es an Ihnen, das richtige Format zu definieren.
Funktionen zum Festlegen von Datenformaten und Rollen (wie z. B. die Angabe der abhängigen Variablen für die Modellierung) können an einer Vielzahl von Stellen in Ihrer Data-Mining-Anwendung eingebettet werden. Sie können die Formate und die Rolle von Variablen innerhalb einer Datendatei definieren, bevor Sie sogar eine Data-Mining-Anwendung öffnen (die nativen Datenformate für Orange und Weka erlauben dies), als Teil des Imports oder einige Zeit später im Prozess.
Sie verfügen möglicherweise über Werkzeuge, die für diesen Zweck erstellt wurden, wie die in den folgenden Abbildungen gezeigten Werkzeuge, oder Sie können diese Eigenschaften in anderen Prozeduren definieren.
Jede Data Mining-Anwendung verfügt über einen eigenen Satz von Variablentypen und eigenen Grenzen für die Verwendung jedes Typs. Einige dieser Grenzen basieren auf der Theorie. Beispielsweise können Sie nur Zahlen und nicht Buchstaben hinzufügen und subtrahieren. Aber andere können nur eine Frage der Gestaltung der Anwendung sein.
So können Sie zum Beispiel feststellen, dass ein bestimmtes Modellierungswerkzeug in einer Anwendung es Ihnen ermöglicht, sowohl kategoriale als auch kontinuierliche Variablen vorherzusagen, aber ein ähnliches Werkzeug in einer anderen Anwendung kann die Modellierung nur eines oder des anderen ermöglichen.