Video: What is Data Analytics - 5 Concepts of Data Analytics [2019] 2024
Trotz allem, was Ihnen über Annahmen gesagt wurde, die Probleme verursachen, bleiben einige Annahmen im Kern jedes Vorhersageanalysemodells. Diese Annahmen tauchen in den Variablen auf, die in der Analyse ausgewählt und berücksichtigt wurden - und diese Variablen beeinflussen direkt die Genauigkeit der Ausgabe des endgültigen Modells.
Deshalb sollten Sie zu Beginn am besten wissen, welche Annahmen für Ihr Modell am wichtigsten sind - und sie auf ein absolutes Minimum beschränken.
Die Erstellung eines prädiktiven Modells, das in der realen Welt gut funktioniert, erfordert eine genaue Kenntnis des Geschäfts. Ihr Modell beginnt mit der Kenntnis nur der Beispieldaten - in der Praxis fast nichts. Beginne also klein und verbessere das Modell nach Bedarf weiter.
Das Erforschen möglicher Fragen und Szenarien kann zu entscheidenden Entdeckungen führen und / oder kann die in der realen Welt vorhandenen Faktoren besser beleuchten. Dieser Prozess kann die Kernvariablen identifizieren, die das Ergebnis der Analyse beeinflussen könnten.
In einem systematischen Ansatz zur Vorhersageanalyse ist diese Phase, in der "Was-wäre-wenn" -Szenarien untersucht werden, besonders interessant und nützlich. Hier ändern Sie die Modelleingaben, um die Auswirkungen der einen oder anderen Variablen auf die Ausgabe des Modells zu messen. Was Sie wirklich testen, ist seine Prognosefähigkeit.
Die Verbesserung der Annahmen des Modells - durch Testen, wie sie die Ausgabe des Modells beeinflussen, wie sensibel das Modell für sie ist und wie sie auf ein Minimum reduziert werden - hilft Ihnen dabei, das Modell zu einer zuverlässigeren Vorhersagefähigkeit zu führen. Bevor Sie Ihr Modell optimieren können, müssen Sie die Vorhersagevariablen kennen - Features, die sich direkt auf die Ausgabe auswirken.
Sie können diese Entscheidungsvariablen ableiten, indem Sie mehrere Simulationen Ihres Modells ausführen - wobei Sie bei jedem Lauf einige Parameter ändern - und die Ergebnisse aufzeichnen, insbesondere die Genauigkeit der Modellvorhersagen. Üblicherweise können Sie Schwankungen in der Genauigkeit auf die von Ihnen geänderten Parameter zurückführen.
An diesem Punkt kann sich das einundzwanzigste Jahrhundert an den 14. wenden, um Hilfe zu erhalten. William of Ockham, ein englischer Franziskanermönch und scholastischer Philosoph, der um 1300 lebte, entwickelte das Forschungsprinzip, das als Occam's Razor bekannt ist: Sie sollten unnötige Annahmen wegschneiden, bis Ihre Theorie so wenige wie möglich hat. Dann ist es wahrscheinlich, wahr zu sein.
Zu viele Annahmen belasten die Prognosen Ihres Modells mit Unsicherheiten und Ungenauigkeiten.Das Eliminieren unnötiger Variablen führt zu einem robusteren Modell, aber es ist nicht einfach zu entscheiden, welche Variablen in die Analyse einbezogen werden sollen - und diese Entscheidungen beeinflussen direkt die Leistung des Modells.
Aber hier kann der Analytiker in ein Dilemma geraten: Die Einbeziehung unnötiger Faktoren kann die Ausgabe des Modells verfälschen oder verzerren, aber wenn eine relevante Variable ausgeschlossen wird, bleibt das Modell unvollständig.
Wenn es also an der Zeit ist, diese alles entscheidenden Entscheidungsvariablen auszuwählen, rufen Sie Ihre Domänen-Experten an. Wenn Sie einen genauen, realitätsbasierten Satz von Entscheidungsvariablen haben, müssen Sie nicht zu viele Annahmen treffen - und das Ergebnis kann weniger Fehler in Ihrem Vorhersagemodell sein.