Inhaltsverzeichnis:
- Aufgabe: Identifizieren Ihrer Geschäftsziele
- Aufgabe: Ihre Situation bewerten
- Aufgabe: Definieren Ihrer Data-Mining-Ziele
- Aufgabe: Erstellung Ihres Projektplans
Video: Phase 1 des Abrisses 2024
Der branchenübergreifende Standardprozess für Data Mining ( CRISP-DM ) ist das dominierende Prozess-Framework Für Data Mining: In der ersten Phase eines Data-Mining-Projekts definieren Sie, bevor Sie an Daten oder Tools herantreten, was Sie erreichen möchten, und definieren die Gründe, warum Sie dieses Ziel erreichen möchten.
vier Tasks (primäre Aktivitäten, von denen jede mehrere kleinere Teile umfassen kann).
Aufgabe: Identifizieren Ihrer Geschäftsziele
Das erste, was Sie tun müssen In jedem Projekt geht es darum, herauszufinden, was genau Sie erreichen wollen. Das ist weniger offensichtlich, als es sich anhört. Viele Data Miner haben Zeit in die Datenanalyse investiert, nur um festzustellen, dass ihr Management nicht besonders an dem Thema interessiert war. Sie müssen mit einem klaren Verständnis von
-
beginnen. Ein Problem, das Ihr Management ansprechen möchte
-
Unternehmensziele
-
Einschränkungen (Einschränkungen, was Sie tun können, welche Arten von Lösungen verwendet werden können, wann die Arbeit abgeschlossen werden muss usw.)
-
Auswirkungen (wie das Problem und mögliche Lösungen in das Unternehmen passen))
Die Ergebnisse dieser Aufgabe umfassen drei Elemente (normalerweise kurze Berichte, die sich nur auf die Hauptpunkte konzentrieren):
-
Hintergrund: Erklären Sie die Geschäftssituation, die das Projekt steuert. Dieser Punkt, wie viele, die folgen, beträgt nur ein paar Absätze.
-
Unternehmensziele: Legen Sie fest, was Ihre Organisation mit dem Projekt erreichen möchte. Dies ist in der Regel ein breiteres Ziel als Sie als Data Miner unabhängig voneinander erreichen können. Das Geschäftsziel könnte beispielsweise darin bestehen, den Umsatz aus einer Urlaubsanzeige im Jahresvergleich um 10 Prozent zu steigern.
-
Geschäftserfolgskriterien: Legen Sie fest, wie die Ergebnisse gemessen werden. Versuchen Sie klar definierte quantitative Erfolgskriterien zu erhalten. Wenn Sie subjektive Kriterien verwenden müssen (Hinweis: Begriffe wie gewinnen Einblick oder bekommen einen Griff auf implizieren subjektive Kriterien), zumindest eine Einigung darüber, wer genau beurteilen wird, ob diese Kriterien haben oder nicht erfüllt.
Aufgabe: Ihre Situation bewerten
Hier erfahren Sie mehr über die mit Ihren Unternehmenszielen verbundenen Probleme. Jetzt werden Sie tiefer in die Faktenfindung einsteigen und eine viel fleischigere Erklärung der in der Aufgabe "Geschäftsziele" dargelegten Probleme erstellen.
Die Ergebnisse dieser Aufgabe umfassen fünf ausführliche Berichte:
-
Inventar der Ressourcen: Eine Liste aller für das Projekt verfügbaren Ressourcen.Dazu können Personen gehören (nicht nur Data Miner, sondern auch solche mit Expertenwissen über das Geschäftsproblem, Datenmanager, technischer Support und andere), Daten, Hardware und Software.
-
Anforderungen, Annahmen und Einschränkungen: Die Anforderungen umfassen einen Zeitplan für die Fertigstellung, rechtliche und Sicherheitsverpflichtungen sowie Anforderungen an akzeptable fertige Arbeiten. Dies ist der Punkt, an dem Sie überprüfen müssen, ob Sie Zugriff auf die entsprechenden Daten haben.
-
Risiken und Eventualitäten: Identifizieren Sie Ursachen, die die Fertigstellung des Projekts verzögern könnten, und erstellen Sie einen Notfallplan für jedes Projekt. Wenn beispielsweise ein Internetausfall in Ihrem Büro ein Problem darstellen könnte, könnten Sie möglicherweise in einem anderen Büro arbeiten, bis der Ausfall beendet ist.
-
Terminologie: Erstellen Sie eine Liste mit Geschäftsbegriffen und Data-Mining-Begriffen, die für Ihr Projekt relevant sind, und notieren Sie sie in einem Glossar mit Definitionen (und vielleicht Beispielen), damit alle am Projekt Beteiligten eine gemeinsames Verständnis dieser Begriffe.
-
Kosten und Nutzen: Bereiten Sie eine Kosten-Nutzen-Analyse für das Projekt vor. Versuchen Sie, alle Kosten und Vorteile in Dollar (Euro, Pfund, Yen usw.) anzugeben. Wenn die Vorteile die Kosten nicht wesentlich überschreiten, sollten Sie diese Analyse und Ihr Projekt stoppen und überdenken.
Entscheidungsträger fühlen sich oft wohler damit, Ressourcen für Projekte zu verwenden, die Kosten senken, als solche, die den Umsatz steigern sollen. Suchen Sie daher immer nach Kosteneinsparpotenzialen und sehen Sie zuerst Einsparmöglichkeiten in Ihrem Kosten- und Nutzenbericht.
Aufgabe: Definieren Ihrer Data-Mining-Ziele
Das Erreichen des Unternehmensziels erfordert häufig Maßnahmen von vielen Personen, nicht nur von Data Minern. So, jetzt müssen Sie Ihr kleines Teil innerhalb des größeren Bildes definieren. Wenn das Geschäftsziel beispielsweise darin besteht, die Kundenabwanderung zu reduzieren, könnten Ihre Data-Mining-Ziele beispielsweise sein, die Ausfallraten für mehrere Kundensegmente zu ermitteln und Modelle zu entwickeln, um vorherzusagen, welche Kunden am stärksten gefährdet sind.
Die Ergebnisse dieser Aufgabe umfassen zwei Berichte:
-
Data-Mining-Ziele: Definieren Sie Data Mining-Ergebnisse wie Modelle, Berichte, Präsentationen und verarbeitete Datasets.
-
Data-Mining-Erfolgskriterien: Definieren Sie die technischen Kriterien für das Data Mining, die zur Unterstützung der Geschäftserfolgskriterien erforderlich sind. Versuchen Sie, diese quantitativ zu definieren (z. B. Modellgenauigkeit oder vorausschauende Verbesserung im Vergleich zu einer bestehenden Methode). Wenn die Kriterien qualitativ sein müssen, identifizieren Sie die Person, die die Bewertung vornimmt.
Aufgabe: Erstellung Ihres Projektplans
Nun geben Sie jeden Schritt an, den Sie, der Data Miner, bis zum Abschluss des Projekts durchführen wollen und die Ergebnisse präsentieren und überprüfen.
Die Ergebnisse dieser Aufgabe umfassen zwei Berichte:
-
Projektplan: Beschreiben Sie Ihren Schritt-für-Schritt-Aktionsplan für das Projekt. Erweitern Sie die Gliederung mit einem Zeitplan für den Abschluss jedes Schritts, erforderlichen Ressourcen, Eingaben (z. B. Daten oder eine Besprechung mit einem Sachverständigen) und Ausgaben (z. B. bereinigte Daten, ein Modell oder ein Bericht) für jeden Schritt. Abhängigkeiten (Schritte, die nicht beginnen können, bis dieser Schritt abgeschlossen ist).Erklären Sie ausdrücklich, dass bestimmte Schritte wiederholt werden müssen (z. B. erfordern Modellierung und Evaluierung in der Regel mehrere Hin- und Her-Wiederholungen).
-
Erste Bewertung von Tools und Techniken: Identifizieren Sie die erforderlichen Funktionen zum Erfüllen Ihrer Data Mining-Ziele und bewerten Sie die Tools und Ressourcen, über die Sie verfügen. Wenn etwas fehlt, müssen Sie dieses Problem sehr früh in Angriff nehmen.