Video: Unit 3 12 General Bayes Networks 2024
Das Markov Modell ist ein statistisches Modell, das in der vorausschauenden Analytik verwendet werden kann, die stark auf der Wahrscheinlichkeitstheorie beruht. (Es wurde nach einem russischen Mathematiker benannt, dessen primäre Forschung in der Wahrscheinlichkeitstheorie war.)
Hier ist ein praktisches Szenario, das zeigt, wie es funktioniert: Stellen Sie sich vor, Sie möchten vorhersagen, ob Team X das morgige Spiel gewinnt. Das erste, was zu tun ist, ist es, frühere Statistiken über Team X zu sammeln. Die Frage, die sich ergeben könnte, ist, wie weit zurück Sie in der Geschichte gehen sollten?
Nehmen wir an, Sie konnten die letzten 10 letzten Spiele in der Folge erreichen. Sie möchten wissen, wie wahrscheinlich es ist, dass Team X das nächste Spiel gewinnt, wenn Sie die Ergebnisse der letzten 10 Spiele berücksichtigen.
Das Problem ist, dass je weiter man in die Geschichte zurückgeht, desto schwieriger und komplexer werden die Datenerfassung und Wahrscheinlichkeitsberechnung.
Ob Sie es glauben oder nicht, das Markov-Modell vereinfacht Ihr Leben, indem es Ihnen die Markov Annahme, , zur Verfügung stellt, die so aussieht, wenn Sie sie in Worte fassen:
Die Wahrscheinlichkeit, dass ein Ereignis eintritt, wenn n in der Vergangenheit eingetreten ist, entspricht ungefähr der Wahrscheinlichkeit, dass ein solches Ereignis nur bei dem letzten vergangenen Ereignis eintritt.
Als Formel geschrieben, sieht die Markov-Annahme wie folgt aus:
Wie auch immer, die Markov-Annahme bedeutet, dass Sie nicht zu weit in die Vergangenheit zurückgehen müssen, um das Ergebnis von morgen vorherzusagen. Sie können einfach das letzte Ereignis der letzten Zeit verwenden. Dies wird als Markov-Vorhersage erster Ordnung bezeichnet, da Sie nur das letzte Ereignis berücksichtigen, um das zukünftige Ereignis vorherzusagen.
Eine Markov-Vorhersage zweiter Ordnung enthält nur die letzten beiden Ereignisse, die in der Sequenz auftreten. Aus der eben gegebenen Gleichung kann auch die folgende weit verbreitete Gleichung abgeleitet werden:
Diese Gleichung zielt darauf ab, die Wahrscheinlichkeit zu berechnen, dass einige Ereignisse der Reihe nach auftreten: Ereignis 1 nach Ereignis 2 und so weiter. Diese Wahrscheinlichkeit kann berechnet werden, indem die Wahrscheinlichkeit jedes -Ereignisses t (bei Vorliegen des vorhergehenden Ereignisses) mit dem nächsten Ereignis in der Sequenz multipliziert wird. Angenommen, Sie möchten die Wahrscheinlichkeit vorhersagen, dass Team X gewinnt, dann verliert und dann bindet.
So funktioniert ein typisches Vorhersagemodell, das auf einem Markov-Modell basiert. Betrachten Sie das gleiche Beispiel: Angenommen, Sie möchten die Ergebnisse eines Fußballspiels vorhersagen, das von Team X gespielt wird. Die drei möglichen Ergebnisse - -Zustände genannt - sind Gewinn, Verlust oder Unentschieden.
Angenommen, Sie haben vergangene statistische Daten zu den Ergebnissen der Fußballspiele von Team X gesammelt, und Team X hat sein neuestes Spiel verloren. Sie wollen das Ergebnis des nächsten Fußballspiels vorhersagen. Es geht darum, zu erraten, ob Team X gewinnen, verlieren oder binden wird - nur auf Daten vergangener Spiele angewiesen. Also hier ist, wie Sie ein Markov-Modell verwenden, um diese Vorhersage zu machen.
-
Berechnen Sie einige Wahrscheinlichkeiten basierend auf vergangenen Daten.
Wie oft hat Team X beispielsweise Spiele verloren? Wie oft hat Team X Spiele gewonnen? Stellen Sie sich beispielsweise vor, ob Team X insgesamt 6 Spiele von insgesamt zehn Spielen gewonnen hat. Dann hat Team X 60 Prozent der Zeit gewonnen. Mit anderen Worten, die Wahrscheinlichkeit, für Team X zu gewinnen, beträgt 60 Prozent.
-
Berechnen Sie die Wahrscheinlichkeit eines Verlusts und dann die Wahrscheinlichkeit eines Gleichstands auf die gleiche Weise.
-
Verwenden Sie die Naïve Bayes-Wahrscheinlichkeitsgleichung, um Wahrscheinlichkeiten wie die folgenden zu berechnen:
-
Die Wahrscheinlichkeit, dass Team X gewinnt, da Team X das letzte Spiel verloren hat.
-
Die Wahrscheinlichkeit, dass Team X verlieren wird, da Team X das letzte Spiel gewonnen hat.
-
-
Berechnen Sie die Wahrscheinlichkeiten für jeden Status (Gewinn, Verlust oder Gleichstand).
-
Unter der Annahme, dass das Team nur ein Spiel pro Tag spielt, sind die Wahrscheinlichkeiten wie folgt:
-
P (Sieg | Verlust) ist die Wahrscheinlichkeit, dass Team X heute gewinnt, da es gestern verloren hat.
-
P (Win | Tie) ist die Wahrscheinlichkeit, dass Team X heute gewinnen wird, da es gestern gestanden hat.
-
P (Win | Win) ist die Wahrscheinlichkeit, dass Team X heute gewinnt, da es gestern gewonnen hat.
-
-
Erstellen Sie mithilfe der berechneten Wahrscheinlichkeiten ein Diagramm.
Ein Kreis in diesem Diagramm stellt einen möglichen Zustand dar, den Team X zu einem bestimmten Zeitpunkt erreichen konnte (Sieg, Verlust, Unentschieden). Die Zahlen auf den Pfeilen geben die Wahrscheinlichkeit an, dass sich Team X von einem Zustand in einen anderen bewegen kann.
Wenn zum Beispiel Team X gerade das heutige Spiel gewonnen hat (sein aktueller Status = Sieg), beträgt die Wahrscheinlichkeit, dass das Team erneut gewinnt, 60 Prozent; die Wahrscheinlichkeit, dass sie das nächste Spiel verlieren, beträgt 20 Prozent (in diesem Fall würden sie vom aktuellen Status = gewinnen in den zukünftigen Status = Verlust wechseln).
Angenommen, Sie möchten die Chancen kennen, dass Team X zwei Spiele hintereinander gewinnen und das dritte verlieren wird. Wie Sie sich vorstellen können, ist das keine einfache Vorhersage.
Wenn Sie jedoch das soeben erstellte Diagramm und die Markov-Annahme verwenden, können Sie leicht die Wahrscheinlichkeit eines solchen Ereignisses vorhersagen. Sie beginnen mit dem Gewinnstatus, gehen erneut durch den Gewinnstatus und nehmen 60 Prozent auf; dann bewegen Sie sich in den Verlustzustand und nehmen 20 Prozent auf.
Die Chancen, dass Team X zweimal gewinnt und das dritte Spiel verliert, werden einfach zu berechnen: 60 Prozent mal 60 Prozent mal 20 Prozent, also 60 Prozent * 60 Prozent * 20 Prozent, was 72 Prozent entspricht.
Was sind die Chancen, dass Team X gewinnt, dann bindet und dann zweimal verliert? Die Antwort ist 20 Prozent (Wechsel vom Gewinn-Zustand zum Gleichstand) mal 20 Prozent (Wechsel vom Tie-to-Loss), mal 35 Prozent (vom Verlust zum Verlust) mal 35 Prozent (vom Verlust zum Verlust). Das Ergebnis ist 49 Prozent.