Video: Predictive Modelling Techniques | Data Science With R Tutorial 2024
Teil von Predictive Analytics für Dummies Cheat Sheet
Ein erfolgreiches Predictive Analytics-Projekt wird Schritt für Schritt ausgeführt. Wenn Sie sich in die Details des Projekts vertiefen, achten Sie auf diese wichtigen Meilensteine:
-
Definieren von Geschäftszielen
Das Projekt beginnt mit einem klar definierten Geschäftsziel. Das Modell soll eine Geschäftsfrage ansprechen. Die klare Angabe dieses Ziels ermöglicht es Ihnen, den Umfang Ihres Projekts zu definieren und liefert Ihnen den genauen Test, um seinen Erfolg zu messen.
-
Daten vorbereiten
Sie trainieren Ihr Modell mit historischen Daten. Die Daten sind normalerweise über mehrere Quellen verstreut und müssen möglicherweise gereinigt und vorbereitet werden. Daten können doppelte Datensätze und Ausreißer enthalten. Abhängig von der Analyse und dem Geschäftsziel entscheiden Sie, ob Sie sie behalten oder entfernen möchten. Außerdem können die Daten fehlende Werte enthalten, müssen möglicherweise einer Transformation unterzogen werden und können verwendet werden, um abgeleitete Attribute zu generieren, die eine größere Vorhersagekraft für Ihr Ziel haben. Insgesamt zeigt die Qualität der Daten die Qualität des Modells an.
-
Daten abtasten
Sie müssen Ihre Daten in zwei Gruppen teilen: Trainings- und Testdatensätze. Sie erstellen das Modell mithilfe des Trainingsdatensatzes. Sie verwenden den Testdatensatz, um die Genauigkeit der Ausgabe des Modells zu überprüfen. Das ist absolut entscheidend. Andernfalls laufen Sie Gefahr, Ihr Modell zu übersteuern - das Modell mit einem begrenzten Datensatz trainieren, bis zu dem Punkt, dass es alle Eigenschaften (sowohl das Signal als auch das Rauschen) auswählt, die nur für diesen bestimmten Datensatz gelten. Ein Modell, das für einen bestimmten Datensatz überarbeitet ist, funktioniert miserabel, wenn es auf anderen Datasets ausgeführt wird. Ein Testdatensatz stellt eine gültige Methode zur genauen Messung der Leistung Ihres Modells sicher.
-
Aufbau des Modells
Manchmal eignen sich die Daten oder die Geschäftsziele für einen bestimmten Algorithmus oder ein bestimmtes Modell. Zu anderen Zeiten ist der beste Ansatz nicht so eindeutig. Während Sie die Daten erkunden, führen Sie so viele Algorithmen wie möglich aus. vergleichen ihre Ausgänge. Orientieren Sie sich bei der Auswahl des endgültigen Modells an den Gesamtergebnissen. Manchmal ist es besser, ein Ensemble von Modellen gleichzeitig auf den Daten zu laufen und ein letztes Modell auszuwählen, indem man ihre Ausgaben vergleicht.
-
Bereitstellen des Modells
Nachdem Sie das Modell erstellt haben, müssen Sie es implementieren, um seine Vorteile nutzen zu können. Dieser Prozess erfordert möglicherweise eine Abstimmung mit anderen Abteilungen. Versuchen Sie, ein implementierbares Modell zu erstellen. Stellen Sie außerdem sicher, dass Sie wissen, wie Sie Ihre Ergebnisse den Geschäftsinteressenten verständlich und überzeugend präsentieren, damit sie Ihr Modell übernehmen.Nachdem das Modell bereitgestellt wurde, müssen Sie die Leistung überwachen und es weiter verbessern. Die meisten Modelle verfallen nach einer gewissen Zeit. Halten Sie Ihr Modell auf dem neuesten Stand, indem Sie es mit neu verfügbaren Daten aktualisieren.