Video: Predictive Analytics – Methoden, Vorgehen, Produkte 2024
Lineare Regression ist eine statistische Methode, die Beziehungen zwischen zwei Variablen analysiert und findet. In der Vorhersageanalyse kann es verwendet werden, um einen zukünftigen numerischen Wert einer Variablen vorherzusagen.
Betrachten wir ein Beispiel für Daten, die zwei Variablen enthalten: frühere Daten, die aus den Ankunftszeiten eines Zuges und seiner entsprechenden Verzögerungszeit bestehen. Angenommen, Sie möchten vorhersagen, wie hoch die Verzögerung für den nächsten Zug sein würde. Wenn Sie eine lineare Regression auf diese beiden Variablen - die Ankunfts- und Verzögerungszeiten - anwenden, können Sie eine lineare Gleichung wie
Verzögerung = a + (b * Ankunftszeit) + d
Diese Gleichung drückt die Beziehung zwischen Verzögerungszeit und Ankunftszeit aus. Die Konstanten a und b sind die Parameter des Modells. Die Variable d ist der Fehlerterm (auch bekannt als Rest ) - ein numerischer Wert, der die Nichtübereinstimmung zwischen den beiden Variablen Verzögerung darstellt. > und Ankunftszeit . Wenn der Fehler ungleich Null ist, könnte dies darauf hindeuten, dass es Kriterien gibt, die die Variable delay beeinflussen.
a berechnen. b, und d . Die lineare Regression ist (wie Sie sich vielleicht vorstellen können) am besten für lineare Daten geeignet. Aber es ist sehr empfindlich gegenüber Ausreißern in den Datenpunkten. Die Ausreißer in Ihren Daten können erhebliche Auswirkungen auf das Modell haben. Es wird empfohlen, diese Ausreißer aus dem Trainingssatz zu entfernen, wenn Sie die lineare Regression für Ihr Vorhersagemodell verwenden möchten.