Zuhause Persönliche Finanzen Umgang mit Ausreißern, die durch Fehler im System verursacht werden - Dummies

Umgang mit Ausreißern, die durch Fehler im System verursacht werden - Dummies

Video: My Friend Irma: The Red Hand / Billy Boy, the Boxer / The Professor's Concerto 2024

Video: My Friend Irma: The Red Hand / Billy Boy, the Boxer / The Professor's Concerto 2024
Anonim

Wenn Sie sich auf Technologie oder Instrumentierung verlassen, um eine Vorhersageanalyse-Aufgabe auszuführen, kann eine Störung hier oder da dazu führen, dass diese Instrumente extreme oder ungewöhnliche Werte registrieren. Wenn Sensoren Beobachtungswerte registrieren, die grundlegende Qualitätskontrollstandards nicht erfüllen, können sie echte Störungen erzeugen, die sich in Daten widerspiegeln.

Jemand, der eine Dateneingabe durchführt, kann zum Beispiel leicht eine zusätzliche 0 am Ende eines Wertes hinzufügen, indem er den Eintrag aus dem Bereich herausnimmt und einen Ausreißer erzeugt.

Wenn Sie sich Beobachtungsdaten ansehen, die von einem in Baltimore Harbour installierten Wassersensor gesammelt wurden - und der eine Wassertiefe von 20 Fuß über dem Meeresspiegel anzeigt - haben Sie einen Ausreißer. Der Sensor ist offensichtlich falsch, wenn Baltimore nicht vollständig von Wasser bedeckt ist.

Daten können aufgrund von externen Ereignissen oder einem Fehler einer Person oder eines Instruments Ausreißer sein.

Wenn ein echtes Ereignis wie ein Flash-Crash auf einen Fehler im System zurückzuführen ist, sind die Konsequenzen immer noch real - aber wenn Sie die Ursache des Problems kennen, können Sie zu dem Schluss kommen, dass ein Fehler in den Daten und nicht in Ihrem Modell vorliegt., war schuld, wenn Ihr Modell das Ereignis nicht vorhersagte.

Wenn Sie die Quelle des Ausreißers kennen, wird Ihre Entscheidung darüber, wie Sie damit umgehen sollen, bestimmt. Ausreißer, die das Ergebnis von Fehlern bei der Dateneingabe sind, können leicht korrigiert werden, nachdem die Datenquelle konsultiert wurde. Ausreißer, die eine Änderungsrealität widerspiegeln, können Sie dazu auffordern, Ihr Modell zu ändern.

Es gibt keine one-size-fits-all-Antwort, wenn Sie entscheiden, ob Sie extreme Daten einschließen oder ignorieren möchten, bei denen es sich nicht um einen Fehler oder eine Störung handelt. Ihre Antwort hängt von der Art der Analyse ab, die Sie durchführen - und vom Typ des Modells, das Sie erstellen. In einigen Fällen ist der Umgang mit diesen Ausreißern einfach:

  • Wenn Sie Ihren Ausreißer bei der Abfrage der Datenquelle auf einen Dateneingabefehler zurückverfolgen, können Sie die Daten leicht korrigieren und (wahrscheinlich) das Modell beibehalten.

  • Wenn dieser Wassersensor in Baltimore Harbour Wasser bis zu einer Tiefe von 20 Fuß über dem Meeresspiegel anzeigt und Sie in Baltimore sind, schauen Sie aus dem Fenster:

    • Wenn Baltimore nicht vollständig von Wasser bedeckt ist, ist offensichtlich falsch.

    • Wenn du einen Fisch siehst, der auf dich schaut, hat sich die Realität verändert; Sie müssen möglicherweise Ihr Modell überarbeiten.

  • Der Flash-Crash könnte ein einmaliges Ereignis gewesen sein (zumindest kurzfristig), aber seine Auswirkungen waren real - und wenn Sie den Markt längerfristig studiert haben, wissen Sie, dass etwas ähnliches noch einmal passieren kann…Wenn Ihr Unternehmen im Finanzbereich tätig ist und Sie sich ständig mit dem Aktienmarkt beschäftigen, möchten Sie, dass Ihr Modell solche Abweichungen berücksichtigt.

Wenn das Ergebnis eines Ereignisses, das normalerweise als Ausreißer betrachtet wird, einen erheblichen Einfluss auf Ihr Unternehmen haben kann, sollten Sie im Allgemeinen überlegen, wie Sie mit diesen Ereignissen in Ihrer Analyse umgehen müssen. Beachten Sie diese allgemeinen Punkte bei Ausreißern:

  • Je kleiner der Datensatz ist, desto aussagekräftiger können die Auswirkungsausreißer auf die Analyse sein.

  • Achten Sie beim Entwickeln Ihres Modells darauf, dass Sie auch Techniken entwickeln, um Ausreißer zu finden und deren Auswirkungen auf Ihr Unternehmen systematisch zu verstehen.

  • Das Erkennen von Ausreißern kann ein komplexer Prozess sein. Es gibt keine einfache Möglichkeit, sie zu identifizieren.

  • Ein Domänenexperte (jemand, der das von Ihnen modellierte Feld kennt) ist Ihre beste Ansprechpartnerin, um zu überprüfen, ob ein Datenpunkt gültig ist, ein Ausreißer, den Sie ignorieren können, oder ein Ausreißer, den Sie haben. berücksichtigen. Der Domänenexperte sollte in der Lage sein, zu erklären, welche Faktoren den Ausreißer verursacht haben, welche Variabilität er aufweist und welche Auswirkungen dies auf das Unternehmen hat.

  • Visualisierungstools können Ihnen helfen, Ausreißer in den Daten zu erkennen. Wenn Sie den erwarteten Wertebereich kennen, können Sie auch problemlos Daten abfragen, die außerhalb dieses Bereichs liegen.

Umgang mit Ausreißern, die durch Fehler im System verursacht werden - Dummies

Die Wahl des Herausgebers

Netzwerkgrundlagen: IPv6-Adresse Vereinfachte Notation - Dummies

Netzwerkgrundlagen: IPv6-Adresse Vereinfachte Notation - Dummies

Bei der Arbeit mit IPv6-Adressen kann es viel Zeit in Anspruch nehmen. schreibe deine Adressen - immerhin sind sie 128 Bit lang. Um das Leben einfacher zu machen, gibt es einige Regeln, die Sie verwenden können, um diese Schreibweise zu verdichten: Führende Nullen in der Adresse sind optional. Für einen Adressblock wäre also 0A45 gleich A45, ...

Netzwerkgrundlagen: IP-Netzwerkklassen - Dummies

Netzwerkgrundlagen: IP-Netzwerkklassen - Dummies

Netzwerkadressierungsarchitektur unterteilt den Adressraum für Internet Protocol Version 4 (IPv4 ) in fünf Adressklassen. Jede Klasse, die in den ersten vier Bits der Adresse codiert ist, definiert entweder eine andere Netzwerkgröße, d.h. e. Anzahl der Hosts für Unicast-Adressen (Klassen A, B, C) oder Multicast-Netzwerk (Klasse D). Die fünfte Klasse (E) address ...

Netzwerkgrundlagen: Netzwerkport Übersicht - Dummys

Netzwerkgrundlagen: Netzwerkport Übersicht - Dummys

In TCP / IP- und UDP-Netzwerken ist ein Port ein Endpunkt eine logische Verbindung. Die Portnummer gibt an, um welchen Port es sich handelt. Port 80 wird beispielsweise für HTTP-Datenverkehr verwendet. Wenn Sie einen Befehl wie netstat -n unter Microsoft Windows oder Linux verwenden, sehen Sie eine Auflistung der lokalen Adressen ...

Die Wahl des Herausgebers

Excel-Dashboards: Wie Sie Ihr erstes Makro aufzeichnen - Dummies

Excel-Dashboards: Wie Sie Ihr erstes Makro aufzeichnen - Dummies

Wenn Sie ein Anfänger auf dem Dashboard sind Automatisierung in Excel ist es unwahrscheinlich, dass Sie den VBA-Code (Visual Basic für Applikationen) von Hand schreiben können, um Makros zu erstellen. Ohne vollständige Kenntnis des Objektmodells und der Syntax von Excel wäre das Schreiben des benötigten Codes für die meisten Anfänger unmöglich. Hier können Sie ein Makro aufzeichnen ...

Excel-Formelberechnungsmodi - Dummys

Excel-Formelberechnungsmodi - Dummys

Standardmäßig ist Excel so eingestellt, dass es automatisch neu berechnet wird. Wenn Sie eine der Zellen ändern, auf die in einer bestimmten Formel verwiesen wird, berechnet Excel diese Formel automatisch neu, sodass ein korrektes Ergebnis basierend auf den Änderungen in den Zellbezügen zurückgegeben wird. Wenn die Formel, die neu berechnet wird, auch als Zellenreferenz in anderen verwendet wird ...

Excel Formelfehler - Dummies

Excel Formelfehler - Dummies

Es ist nicht immer glatt, wenn Sie mit Excel-Formeln arbeiten. Manchmal gibt eine Formel einen Fehlerwert anstelle des erwarteten Werts zurück. Excel hilft Ihnen, das Problem zu identifizieren, indem Sie einen von sieben Fehlerwerten zurückgeben: # DIV / 0! , # N / A, #NAME? , #NULL! , #NUM! , #REF! und #WERT! , erklärt in der folgenden Liste: # DIV / 0! : ...

Die Wahl des Herausgebers

Teilen, Weiterverbreiten und Kommentieren von Google+ Posts - Dummies

Teilen, Weiterverbreiten und Kommentieren von Google+ Posts - Dummies

, Wenn Sie mit der Verwendung und Veröffentlichung beginnen Bei Google+ möchten Sie gelegentlich Links und Bilder teilen, die Beiträge anderer freigeben, ihre Beiträge kommentieren und andere in Ihren eigenen Google+ Beiträgen erwähnen. Vielleicht fragen Sie sich auch, wie Sie andere dazu bringen, Ihre eigenen Beiträge öfter zu kommentieren. Teilen von Links und Bildern in Google+ So geben Sie ein ...

Teilen Ihrer Google+ Posts mit bestimmten Personen - Dummies

Teilen Ihrer Google+ Posts mit bestimmten Personen - Dummies

Beiträge auf Google+ sind ganz einfach und können posten Text, Links, Fotos, Videos und sogar Ihren aktuellen Standort. Der schwierigste Teil des Beitrags auf Google+ besteht darin, auszuwählen, wen Sie Ihren Beitrag sehen möchten. Google+ verwendet Ihre Kreise, um festzulegen, wer Ihre Beiträge sehen kann. Kreise sind etwas einfacher als Listen, weil ...

Taggen von Personen in Google+ Fotos - Dummies

Taggen von Personen in Google+ Fotos - Dummies

Sie können Personen in Ihren Kreisen auf jedem Foto auf Google+ markieren. Wenn Sie eine Person in einem Foto taggen, wird diese Person über ihre Google+ Benachrichtigungen benachrichtigt. Sie können dann das Tag entfernen oder genehmigen, und das Foto wird mit dem Tag des Namens dieser Person darin angezeigt. Um jemanden zu markieren, ...