Inhaltsverzeichnis:
- Konzentration auf das Data-Mining-Geschäft
- Verstehen, wie Data Miner ihre Zeit verbringen
- Den Data-Mining-Prozess kennenlernen
- Modelle erstellen
- Mathematische Modelle sind von zentraler Bedeutung für Data Mining, aber was sind sie? Was machen sie, wie arbeiten sie und wie entstehen sie?
- Ein Modell liefert nur Werte, wenn Sie es im Unternehmen verwenden. Die Vorhersagen eines Modells können die Entscheidungsfindung auf verschiedene Weise unterstützen. Sie können
Video: Neue Perks aufgetaucht | Content Leak durch Dataminer | Fallout 76 2024
Wenn Sie Daten als Rohstoff betrachten und die Informationen, die Sie aus Daten gewinnen können, als wertvoll und relativ verfeinert gelten, kann der Prozess des Extrahierens von Informationen verglichen mit der Gewinnung von Metall aus Erzen oder Edelsteinen von Schmutz. So entstand der Begriff Data Mining .
Konzentration auf das Data-Mining-Geschäft
Data Miner denken nicht nur ziellos über Daten nach, in der Hoffnung, etwas Interessantes zu finden. Jedes Data-Mining-Projekt beginnt mit einem spezifischen Geschäftsproblem und hat das Ziel, eine Übereinstimmung zu erzielen.
Als Data Miner haben Sie wahrscheinlich nicht die Entscheidungsbefugnis, daher ist es wichtig, dass Sie Ihre Arbeit auf die Bedürfnisse der Entscheidungsträger ausrichten. Sie müssen ihre Probleme, Bedürfnisse und Vorlieben verstehen und sich darauf konzentrieren, Informationen bereitzustellen, die gute Geschäftsentscheidungen unterstützen.
Ihr eigenes Geschäftswissen ist sehr wichtig. Führungskräfte werden während Ihrer Arbeit nicht neben Ihnen sitzen und Feedback zu der Relevanz Ihrer Entdeckungen für ihre Anliegen geben. Sie müssen Ihre eigene Erfahrung und Ihren eigenen Scharfsinn anwenden, um dies selbst zu beurteilen, während Sie arbeiten.
Verstehen, wie Data Miner ihre Zeit verbringen
Es wäre großartig, wenn Data Miner den ganzen Tag damit verbringen könnten, lebensverändernde Entdeckungen zu machen, wertvolle Modelle zu erstellen und sie in den Geschäftsalltag zu integrieren. Aber das ist so, als ob es großartig wäre, wenn Athleten den ganzen Tag lang Turniere gewinnen könnten. Es bedarf einer Menge Vorbereitung, um diese Momente des Triumphs aufzubauen. Data-Miner verbringen also wie Athleten viel Zeit mit der Vorbereitung.
Den Data-Mining-Prozess kennenlernen
Ein guter Arbeitsprozess hilft Ihnen dabei, Ihre Zeit, Ihre Daten und all Ihre anderen Ressourcen optimal zu nutzen. In diesem Buch finden Sie den populärsten Data-Mining-Prozess, CRISP-DM. Es handelt sich um einen Sechs-Phasen-Zyklus von Discovery und Action, der von einem Konsortium von Data Minern aus vielen Branchen erstellt wurde, und von einem offenen Standard, den jeder verwenden kann.
Die Phasen des CRISP-DM-Prozesses sind
-
Business Understanding
-
Datenverständnis
-
Datenaufbereitung
-
Modellierung
-
Auswertung
-
Bereitstellung (unter Verwendung von Modellen im Tagesgeschäft)
Phase gleich wichtig für die Qualität der Ergebnisse und Wert für das Geschäft. In Bezug auf die benötigte Zeit dominiert jedoch die Datenaufbereitung. Die Datenvorbereitung dauert routinemäßig mehr Zeit als alle anderen Phasen des Data-Mining-Prozesses zusammen.
Modelle erstellen
Wenn die Ziele verstanden und die Daten bereinigt und einsatzbereit sind, können Sie sich auf das Erstellen von Vorhersagemodellen konzentrieren.Modelle tun, was Berichte nicht können; Sie geben Ihnen Informationen, die Aktionen unterstützen.
Ein Bericht kann Ihnen mitteilen, dass der Umsatz rückläufig ist. Sie kann den Umsatz nach Regionen, Produkten und Vertriebskanälen senken, sodass Sie wissen, wo die Umsätze zurückgegangen sind und ob diese Rückgänge weit verbreitet waren oder nur bestimmte Bereiche betreffen. Aber sie geben Ihnen keine Hinweise darauf, warum der Umsatz zurückging oder welche Maßnahmen zur Wiederbelebung des Geschäfts beitragen könnten. Modelle helfen Ihnen, die Faktoren zu verstehen, die sich auf den Umsatz auswirken, die Aktionen, die dazu neigen, den Umsatz zu steigern oder zu senken, und die Strategien und Taktiken, die dafür sorgen, dass Ihr Unternehmen reibungslos funktioniert. Das ist aufregend, nicht wahr? Vielleicht ist das der Grund, warum die meisten Data Miner das Modellieren als den spaßigen Teil des Jobs betrachten.
Mathematische Modelle verstehen
Mathematische Modelle sind von zentraler Bedeutung für Data Mining, aber was sind sie? Was machen sie, wie arbeiten sie und wie entstehen sie?
Ein mathematisches Modell ist, schlicht und einfach, eine Gleichung oder ein Satz von Gleichungen, die eine Beziehung zwischen zwei oder mehr Dingen beschreiben. Solche Gleichungen sind Abkürzungen für Theorien über die Funktionsweise von Natur und Gesellschaft. Die Theorie kann durch eine umfangreiche Beweislage unterstützt werden oder es kann nur eine wilde Vermutung sein. Die Sprache der Mathematik ist in beiden Fällen die gleiche.
Begriffe wie
Vorhersagemodell, statistisches Modell, oder lineares Modell beziehen sich auf bestimmte Arten von mathematischen Modellen, wobei die Namen den Verwendungszweck, die Form oder die Ableitungsmethode widerspiegeln. ein bestimmtes Modell. Diese drei Beispiele sind nur einige von vielen solchen Begriffen. Wenn ein Modell in einer geschäftlichen Umgebung erwähnt wird, ist es wahrscheinlich ein Modell, das verwendet wird, um Vorhersagen zu treffen. Modelle werden verwendet, um Aktienkurse, Produktverkäufe und Arbeitslosenquoten unter vielen anderen Dingen vorherzusagen.
Diese Vorhersagen können genau sein oder nicht, aber für jeden gegebenen Satz von Werten (bekannte Faktoren wie diese heißen
unabhängige Variablen oder Eingaben ), die im Modell enthalten sind, werden Sie Finden Sie eine wohldefinierte Vorhersage (auch als abhängige Variable, Ausgabe, oder Ergebnis bezeichnet). Mathematische Modelle werden auch für andere geschäftliche Zwecke verwendet, beispielsweise um die Arbeitsmechanismen zu beschreiben, die einen bestimmten Prozess steuern. Beim Data Mining erstellen Sie Modelle, indem Sie mithilfe von maschinellem Lernen oder statistischen Methoden Muster in Daten finden. Data Miner folgen nicht dem gleichen rigorosen Ansatz wie klassische Statistiker, sondern alle Modelle basieren auf tatsächlichen Daten und konsistenten mathematischen Modellierungstechniken. Alle Data-Mining-Modelle werden durch eine Reihe von Beweisen unterstützt.
Warum mathematische Modelle verwenden? Könnten nicht dieselben Beziehungen mit Wörtern beschrieben werden? Das ist möglich, dennoch finden Sie bestimmte Vorteile bei der Verwendung von Gleichungen. Dazu gehören
Convenience:
-
Im Vergleich zu äquivalenten Beschreibungen in Sätzen sind die Gleichungen kurz. Der mathematische Symbolismus hat sich speziell entwickelt, um mathematische Beziehungen darzustellen; Sprachen wie Englisch haben nicht. Klarheit:
-
Gleichungen übermitteln Ideen prägnant und sind eindeutig.Sie unterliegen keinen unterschiedlichen Interpretationen, die auf Kultur basieren, und die Symbolik der Mathematik ist eine Art gemeinsame Sprache, die auf der ganzen Welt weit verbreitet ist. Konsistenz:
-
Da mathematische Darstellungen eindeutig sind, sind die Auswirkungen einer bestimmten Situation durch ein mathematisches Modell klar definiert. Informationen in die Tat umsetzen
Ein Modell liefert nur Werte, wenn Sie es im Unternehmen verwenden. Die Vorhersagen eines Modells können die Entscheidungsfindung auf verschiedene Weise unterstützen. Sie können
Vorhersagen in einen Bericht oder eine Präsentation einbeziehen, um eine bestimmte Entscheidung treffen zu können.
-
Integrieren Sie das Modell in ein Betriebssystem (z. B. in ein Kundendienstsystem), um Echtzeitvorhersagen für den täglichen Gebrauch bereitzustellen. (Beispielsweise könnten Sie Versicherungsansprüche für sofortige Zahlung, sofortige Ablehnung oder weitere Untersuchung kennzeichnen.)
-
Verwenden Sie das Modell für Batch-Vorhersagen. (Sie könnten beispielsweise die interne Kundenliste bewerten, um zu entscheiden, welche Kunden ein bestimmtes Angebot erhalten sollen.)