Video: Regular Expressions (Regex) Tutorial: How to Match Any Pattern of Text 2024
Von Meta S. Brown
Data Mining ist die Art und Weise, wie gewöhnliche Geschäftsleute eine Reihe von Datenanalysetechniken verwenden, um nützliche Informationen zu finden. Informationen aus Daten und setzen diese Informationen in die Praxis um. Data Miner beschäftigen sich nicht mit Theorie und Annahmen. Sie validieren ihre Entdeckungen durch Tests. Und sie verstehen, dass sich die Dinge ändern, also wenn sich die Entdeckung, die gestern wie ein Zauber funktioniert hat, heute nicht hält, passen sie sich an.
Die 9 Gesetze des Data Mining: Ein Referenzhandbuch
Der wegweisende Data Miner Thomas Khabaza entwickelte seine "neun Data Mining-Gesetze", um neue Data Miner bei der Arbeit zu unterstützen. Dieser Nachschlagewerk zeigt Ihnen, was jedes dieser Gesetze für Ihre tägliche Arbeit bedeutet.
-
1. Gesetz des Data Mining oder "Business Goals Law": Geschäftsziele sind der Ursprung jeder Data Mining-Lösung.
Ein Data Miner ist jemand, der nützliche Informationen aus Daten herausfindet, um bestimmte Geschäftsziele zu unterstützen. Data Mining wird nicht von dem Tool definiert, das Sie verwenden.
-
Zweites Gesetz des Data Mining oder "Business Knowledge Law": Business Knowledge ist zentral für jeden Schritt des Data Mining Prozesses .
Sie müssen kein ausgefallener Statistiker sein, um Data Mining durchzuführen, aber Sie müssen etwas darüber wissen, was die Daten bedeuten und wie das Geschäft funktioniert.
-
3. Gesetz des Data Mining oder "Data Preparation Law": Die Datenaufbereitung ist mehr als die Hälfte jedes Data Mining Prozesses .
So ziemlich jeder Data Miner wird mehr Zeit für die Datenaufbereitung als für die Analyse aufwenden.
-
4. Gesetz des Data Mining oder "Kein kostenloses Mittagessen für den Data Miner": Das richtige Modell für eine bestimmte Anwendung kann nur durch Experiment gefunden werden.
Beim Data Mining werden Modelle durch Versuch und Irrtum ausgewählt.
-
5. Gesetz des Data Mining: Es gibt immer Muster in den Daten .
Als Data Miner erkunden Sie Daten nach nützlichen Mustern. Durch das Verstehen von Mustern in den Daten können Sie beeinflussen, was in der Zukunft passiert.
-
6. Data Mining-Gesetz oder "Insight Law": Data Mining verstärkt die Wahrnehmung im Geschäftsbereich .
Data-Mining-Methoden ermöglichen es Ihnen, Ihr Unternehmen besser zu verstehen, als Sie es ohne sie hätten tun können.
-
7. Gesetz des Data Mining oder "Prediction Law": Prediction erhöht Information lokal durch Generalisierung.
Data Mining hilft uns, das zu nutzen, was wir wissen, um bessere Vorhersagen (oder Schätzungen) von Dingen zu machen, die wir nicht kennen.
-
8. Data Mining-Gesetz oder "Value Law": Der Wert von Data-Mining-Ergebnissen wird nicht durch die Genauigkeit oder Stabilität von Vorhersagemodellen bestimmt.
Ihr Modell muss beständig gute Vorhersagen liefern. Das ist es.
-
9. Gesetz des Data Mining oder "Law of Change": Alle Muster können sich ändern.
Jedes Modell, das heute gute Prognosen liefert, kann morgen nutzlos sein.
Phasen des Data Mining-Prozesses
Der branchenübergreifende Standardprozess für Data Mining ( CRISP-DM ) ist das vorherrschende Data-Mining-Prozess-Framework. Es ist ein offener Standard; Jeder kann es benutzen. Die folgende Liste beschreibt die verschiedenen Phasen des Prozesses.
-
Business-Verständnis: Verschaffen Sie sich ein klares Verständnis des Problems, das Sie lösen möchten, wie es sich auf Ihre Organisation auswirkt und welche Ziele Sie damit erreichen. Zu den Aufgaben in dieser Phase gehören:
-
Identifizieren Ihrer Unternehmensziele
-
Bewerten Ihrer Situation
-
Definieren Ihrer Data Mining-Ziele
-
Erstellen Ihres Projektplans
-
-
Datenverständnis: Überprüfen Sie die Daten, die Sie haben. dokumentieren, Datenmanagement und Datenqualitätsprobleme identifizieren. Aufgaben für diese Phase sind:
-
Sammeln von Daten
-
Beschreiben von
-
Exploring
-
Überprüfen der Qualität
-
-
Datenaufbereitung: Bereitstellen Sie Ihre Daten für die Modellierung. Zu den Aufgaben für diese Phase gehören:
-
Daten auswählen
-
Daten reinigen
-
Konstruieren
-
Integrieren
-
Formatieren
-
-
Modellieren: Verwenden Sie mathematische Verfahren, um Muster in Ihren Daten zu identifizieren. Aufgaben für diese Phase:
-
Auswählen von Techniken
-
Entwerfen von Tests
-
Erstellen von Modellen
-
Bewerten von Modellen
-
-
Auswertung: Überprüfen Sie die gefundenen Muster und bewerten Sie deren Potenzial für die geschäftliche Nutzung. Aufgaben für diese Phase sind:
-
Ergebnisse auswerten
-
Den Prozess überprüfen
-
Die nächsten Schritte bestimmen
-
-
Einsatz: Setzen Sie Ihre Entdeckungen im geschäftlichen Alltag ein. Zu den Aufgaben für diese Phase gehören:
-
Planungsbereitstellung (Ihre Methoden zur Integration von Data Mining-Entdeckungen werden verwendet)
-
Abschließende Ergebnisse melden
-
Endergebnisse überprüfen
-