Video: Kolmogorov-Smirnov-Test in Excel-Test auf Normalverteilung der Daten-Daten analysieren in Excel (28) 2024
Wenn Ihre Daten bereit sind und Sie damit beginnen, Ihr Vorhersagemodell für die Analyse zu erstellen, ist es hilfreich, Ihre Testmethodik zu skizzieren und einen Testplan zu entwerfen. Das Testen sollte von den Geschäftszielen geleitet werden, die Sie gesammelt, dokumentiert und alle erforderlichen Daten gesammelt haben, um Ihnen dabei zu helfen.
Auf Anhieb sollten Sie eine Methode entwickeln, um zu testen, ob ein Geschäftsziel erfolgreich erreicht wurde. Da Vorhersageanalysen die Wahrscheinlichkeit eines zukünftigen Ergebnisses messen - und der einzige Weg, um bereit zu sein, einen solchen Test durchzuführen, ist, Ihr Modell auf vergangenen Daten zu trainieren, Sie müssen noch sehen, was es tun kann, wenn es gegen zukünftige Daten geht.
Natürlich können Sie nicht riskieren, ein unversuchtes Modell für echte zukünftige Daten zu verwenden, also müssen Sie vorhandene Daten verwenden, um zukünftige Daten realistisch zu simulieren. Dazu müssen Sie die Daten, an denen Sie arbeiten, in Trainings- und Test-Datasets aufteilen.
Stellen Sie sicher, dass Sie diese beiden Datensätze nach dem Zufallsprinzip auswählen und dass beide Datensätze alle Datenparameter enthalten und abdecken, die Sie messen.
Wenn Sie Ihre Daten in Test- und Trainingsdatensätze aufteilen, vermeiden Sie effektiv Überanpassungsprobleme, die durch Übertraining des Modells im gesamten Dataset und Aufnehmen aller Rauschmuster oder spezifischer Features auftreten können, die nur zum Beispiel-Dataset gehören. und sind nicht auf andere Datensätze anwendbar.
Die Trennung Ihrer Daten in Trainings- und Testdatensätze, etwa 70 Prozent bzw. 30 Prozent, stellt eine genaue Messung der Leistung des von Ihnen erstellten Vorhersageanalysemodells sicher. Sie möchten Ihr Modell anhand der Testdaten auswerten, da es eine einfache Methode ist, um zu messen, ob die Vorhersagen des Modells korrekt sind.