Zuhause Persönliche Finanzen Verwendung von Datenglättung in Predictive Analytics - Dummies

Verwendung von Datenglättung in Predictive Analytics - Dummies

Inhaltsverzeichnis:

Video: LE5_5a AC/DC Wandler - Leistungsfaktorkorrektur Einführung 2024

Video: LE5_5a AC/DC Wandler - Leistungsfaktorkorrektur Einführung 2024
Anonim

Die Datenglättung in der Vorhersageanalyse versucht im Wesentlichen, das "Signal" im "Rauschen" zu finden, indem Verwerfen von Datenpunkten, die als "verrauscht" gelten. Die Idee besteht darin, die Muster in den Daten zu schärfen und Trends hervorzuheben, auf die die Daten verweisen.

Die Datenglättung hat zur Folge, dass die Daten aus zwei Teilen bestehen: einem Teil (bestehend aus den Kerndatenpunkten ), der allgemeine Trends oder reale Trends anzeigt, und einem anderen Teil, der hauptsächlich aus Abweichungen besteht ( Rauschen ) - einige schwankende Punkte, die sich aus einer gewissen Volatilität der Daten ergeben. Die Datenglättung versucht diesen zweiten Teil zu eliminieren.

So reduzieren Sie das Rauschen

Die Datenglättung arbeitet mit mehreren Annahmen:

  • Diese Datenfluktuation ist am wahrscheinlichsten Rauschen.

  • Dass der verrauschte Teil der Daten von kurzer Dauer ist.

  • Die Fluktuation der Daten, unabhängig davon, wie unterschiedlich sie ist, hat keinen Einfluss auf die zugrunde liegenden Trends, die durch die Kerndatenpunkte dargestellt werden.

Das Rauschen in Daten ist in der Regel zufällig; ihre Fluktuationen sollten sich nicht auf die Gesamttrends auswirken, die sich aus der Prüfung der übrigen Daten ergeben. Durch die Reduzierung oder Eliminierung verrauschter Datenpunkte können echte Trends und Muster in den Daten verdeutlicht werden, wodurch sich das Signal-Rausch-Verhältnis der Daten verbessert. "

Sofern Sie das Rauschen korrekt erkannt und dann reduziert haben, kann die Datenglättung Ihnen helfen, den nächsten beobachteten Datenpunkt vorherzusagen, indem Sie einfach die wichtigsten Trends verfolgen, die Sie in den Daten erkannt haben.

Datenglättung betrifft die Mehrheit der Datenpunkte, ihre Positionen in einem Graphen und was die resultierenden Muster über den allgemeinen Trend eines (sagen wir) Aktienpreises vorhersagen, ob seine allgemeine Richtung nach oben, unten oder seitwärts gerichtet ist..

Diese Technik wird den genauen Preis des nächsten Trades für einen bestimmten Bestand nicht genau vorhersagen - aber die Vorhersage eines allgemeinen Trends kann zu aussagekräftigeren Einblicken führen als den tatsächlichen Preis oder seine Schwankungen zu kennen.

Eine Prognose, die auf einem allgemeinen Trend basiert, der aus geglätteten Daten abgeleitet wird, geht davon aus, dass die Richtung, in die die Daten bisher getra- gen haben, in der Zukunft konsistent mit dem Trend bleibt. In der Börse zum Beispiel ist die Wertentwicklung in der Vergangenheit kein definitiver Hinweis auf die zukünftige Wertentwicklung, aber sie kann sicherlich ein allgemeiner Leitfaden für die künftige Entwicklung des Aktienkurses sein.

Methoden, Vorteile und Nachteile der Datenglättung

Datenglättung ist nicht zu verwechseln mit Anpassung eines Modells, das Teil der Datenanalyse ist und aus zwei Schritten besteht:

  1. Modell, das die Daten darstellt.

  2. Stellen Sie sicher, dass das Modell effektiv mit den Daten übereinstimmt.

Bei der Datenglättung wird eine grundlegende Richtung für die Kerndatenpunkte festgelegt, indem (1) verrauschte Datenpunkte ignoriert und (2) eine glattere Kurve durch die Datenpunkte gezeichnet wird, die die sich windenden Daten überspringt und primäre Muster - Trends - hervorhebt. die Daten, egal wie langsam ihr Auftauchen ist. Dementsprechend dient in einer numerischen Zeitreihe die Datenglättung als eine Form der Filterung.

Die Datenglättung kann eine der folgenden Methoden verwenden:

  • Die Zufallsbewegung basiert auf der Annahme, dass das nächste Ergebnis oder der zukünftige Datenpunkt eine zufällige Abweichung vom letzten bekannten oder aktuellen Datenpunkt ist…

  • Gleitender Durchschnitt ist ein laufender Durchschnitt von aufeinander folgenden, gleichmäßig verteilten Zeiträumen. Ein Beispiel wäre die Berechnung eines 200 Tage gleitenden Durchschnitts eines Aktienkurses.

  • Die exponentielle Glättung weist den letzten Datenpunkten exponentiell mehr Gewicht oder Wichtigkeit zu als den älteren Datenpunkten.

    • Einfach: Diese Methode sollte verwendet werden, wenn die Zeitreihendaten keinen Trend und keine Saisonalität haben.

    • Linear: Diese Methode sollte verwendet werden, wenn die Zeitreihendaten eine Trendlinie haben.

    • Saisonal: Diese Methode sollte verwendet werden, wenn die Zeitreihendaten keinen Trend, sondern Saisonalität haben.

Allen diesen Glättungsmethoden ist gemeinsam, dass sie an mehreren Datenpunkten einen Mittelungsprozess durchführen. Eine solche Mittelung benachbarter Datenpunkte ist der wesentliche Weg, um zugrunde liegende Trends oder Muster zu erfassen.

Die Vorteile der Datenglättung sind

  • . Sie ist einfach zu implementieren.

  • Es hilft, Trends zu identifizieren.

  • Es hilft, Muster in den Daten freizulegen.

  • Es werden Datenpunkte entfernt, von denen Sie entschieden haben, dass sie nicht von Interesse sind.

  • Es hilft dabei, die allgemeine Richtung der nächsten beobachteten Datenpunkte vorherzusagen.

  • Es erzeugt schöne glatte Graphen.

Aber alles hat einen Nachteil. Die Nachteile der Datenglättung sind

  • . Es können gültige Datenpunkte eliminiert werden, die aus Extremereignissen resultieren.

  • Dies kann zu ungenauen Vorhersagen führen, wenn die Testdaten nur saisonal und nicht vollständig repräsentativ für die Realität sind, die die Datenpunkte generiert hat.

  • Es kann die Daten verschieben oder verfälschen, insbesondere die Spitzen, was zu einem verzerrten Bild dessen führt, was vor sich geht.

  • Es kann zu erheblichen Störungen durch Ausreißer innerhalb der Daten führen.

  • Dies kann zu einer erheblichen Abweichung von den ursprünglichen Daten führen.

Wenn die Datenglättung nur ein Facelifting der Daten bewirkt, kann sie auf folgende Weise grundlegend falsch sein:

  • Sie kann Fehler durch Verzerrungen verursachen, die die geglätteten Daten so behandeln, als wären sie mit dem Original identisch. Daten.

  • Es kann die Interpretation verdrehen, indem es die in die Daten eingebetteten Risiken ignoriert und versteckt.

  • Dies kann zu einem Detailverlust in Ihren Daten führen - eine Möglichkeit, dass eine geglättete Kurve stark von der der ursprünglichen Daten abweicht.

Wie ernsthaft die Datenglättung Ihre Daten beeinflussen kann, hängt von der Art der vorliegenden Daten ab und davon, welche Glättungstechnik für diese Daten implementiert wurde.Wenn beispielsweise die Originaldaten mehr Peaks enthalten, führt die Datenglättung zu einer größeren Verschiebung dieser Peaks in den geglätteten Graphen - höchstwahrscheinlich eine Verzerrung.

Hier einige Hinweise, die Sie bei der Datenglättung beachten sollten:

  • Es ist eine gute Idee, geglättete Graphen mit unberührten Graphen zu vergleichen, die die ursprünglichen Daten darstellen.

  • Während der Datenglättung entfernte Datenpunkte dürfen kein Rauschen sein. Sie könnten gültige, echte Datenpunkte sein, die sich aus seltenen Ereignissen ergeben.

  • Die Datenglättung kann in Maßen hilfreich sein, aber ihre Überbeanspruchung kann zu einer falschen Darstellung Ihrer Daten führen.

Durch die Anwendung Ihres professionellen Urteilsvermögens und Ihrer betriebswirtschaftlichen Fachkenntnisse können Sie die Datenglättung effektiv nutzen. Das Entfernen von Rauschen aus Ihren Daten - ohne die Genauigkeit und Nützlichkeit der ursprünglichen Daten negativ zu beeinflussen - ist mindestens ebenso eine Kunst wie eine Wissenschaft.

Verwendung von Datenglättung in Predictive Analytics - Dummies

Die Wahl des Herausgebers

Netzwerkgrundlagen: IPv6-Adresse Vereinfachte Notation - Dummies

Netzwerkgrundlagen: IPv6-Adresse Vereinfachte Notation - Dummies

Bei der Arbeit mit IPv6-Adressen kann es viel Zeit in Anspruch nehmen. schreibe deine Adressen - immerhin sind sie 128 Bit lang. Um das Leben einfacher zu machen, gibt es einige Regeln, die Sie verwenden können, um diese Schreibweise zu verdichten: Führende Nullen in der Adresse sind optional. Für einen Adressblock wäre also 0A45 gleich A45, ...

Netzwerkgrundlagen: IP-Netzwerkklassen - Dummies

Netzwerkgrundlagen: IP-Netzwerkklassen - Dummies

Netzwerkadressierungsarchitektur unterteilt den Adressraum für Internet Protocol Version 4 (IPv4 ) in fünf Adressklassen. Jede Klasse, die in den ersten vier Bits der Adresse codiert ist, definiert entweder eine andere Netzwerkgröße, d.h. e. Anzahl der Hosts für Unicast-Adressen (Klassen A, B, C) oder Multicast-Netzwerk (Klasse D). Die fünfte Klasse (E) address ...

Netzwerkgrundlagen: Netzwerkport Übersicht - Dummys

Netzwerkgrundlagen: Netzwerkport Übersicht - Dummys

In TCP / IP- und UDP-Netzwerken ist ein Port ein Endpunkt eine logische Verbindung. Die Portnummer gibt an, um welchen Port es sich handelt. Port 80 wird beispielsweise für HTTP-Datenverkehr verwendet. Wenn Sie einen Befehl wie netstat -n unter Microsoft Windows oder Linux verwenden, sehen Sie eine Auflistung der lokalen Adressen ...

Die Wahl des Herausgebers

Excel-Dashboards: Wie Sie Ihr erstes Makro aufzeichnen - Dummies

Excel-Dashboards: Wie Sie Ihr erstes Makro aufzeichnen - Dummies

Wenn Sie ein Anfänger auf dem Dashboard sind Automatisierung in Excel ist es unwahrscheinlich, dass Sie den VBA-Code (Visual Basic für Applikationen) von Hand schreiben können, um Makros zu erstellen. Ohne vollständige Kenntnis des Objektmodells und der Syntax von Excel wäre das Schreiben des benötigten Codes für die meisten Anfänger unmöglich. Hier können Sie ein Makro aufzeichnen ...

Excel-Formelberechnungsmodi - Dummys

Excel-Formelberechnungsmodi - Dummys

Standardmäßig ist Excel so eingestellt, dass es automatisch neu berechnet wird. Wenn Sie eine der Zellen ändern, auf die in einer bestimmten Formel verwiesen wird, berechnet Excel diese Formel automatisch neu, sodass ein korrektes Ergebnis basierend auf den Änderungen in den Zellbezügen zurückgegeben wird. Wenn die Formel, die neu berechnet wird, auch als Zellenreferenz in anderen verwendet wird ...

Excel Formelfehler - Dummies

Excel Formelfehler - Dummies

Es ist nicht immer glatt, wenn Sie mit Excel-Formeln arbeiten. Manchmal gibt eine Formel einen Fehlerwert anstelle des erwarteten Werts zurück. Excel hilft Ihnen, das Problem zu identifizieren, indem Sie einen von sieben Fehlerwerten zurückgeben: # DIV / 0! , # N / A, #NAME? , #NULL! , #NUM! , #REF! und #WERT! , erklärt in der folgenden Liste: # DIV / 0! : ...

Die Wahl des Herausgebers

Teilen, Weiterverbreiten und Kommentieren von Google+ Posts - Dummies

Teilen, Weiterverbreiten und Kommentieren von Google+ Posts - Dummies

, Wenn Sie mit der Verwendung und Veröffentlichung beginnen Bei Google+ möchten Sie gelegentlich Links und Bilder teilen, die Beiträge anderer freigeben, ihre Beiträge kommentieren und andere in Ihren eigenen Google+ Beiträgen erwähnen. Vielleicht fragen Sie sich auch, wie Sie andere dazu bringen, Ihre eigenen Beiträge öfter zu kommentieren. Teilen von Links und Bildern in Google+ So geben Sie ein ...

Teilen Ihrer Google+ Posts mit bestimmten Personen - Dummies

Teilen Ihrer Google+ Posts mit bestimmten Personen - Dummies

Beiträge auf Google+ sind ganz einfach und können posten Text, Links, Fotos, Videos und sogar Ihren aktuellen Standort. Der schwierigste Teil des Beitrags auf Google+ besteht darin, auszuwählen, wen Sie Ihren Beitrag sehen möchten. Google+ verwendet Ihre Kreise, um festzulegen, wer Ihre Beiträge sehen kann. Kreise sind etwas einfacher als Listen, weil ...

Taggen von Personen in Google+ Fotos - Dummies

Taggen von Personen in Google+ Fotos - Dummies

Sie können Personen in Ihren Kreisen auf jedem Foto auf Google+ markieren. Wenn Sie eine Person in einem Foto taggen, wird diese Person über ihre Google+ Benachrichtigungen benachrichtigt. Sie können dann das Tag entfernen oder genehmigen, und das Foto wird mit dem Tag des Namens dieser Person darin angezeigt. Um jemanden zu markieren, ...