Zuhause Persönliche Finanzen Die Grenzen der Daten in Predictive Analytics - Dummies

Die Grenzen der Daten in Predictive Analytics - Dummies

Video: COMPUTERWOCHE Round Table: Predictive Analytics - wo Mehrwert noch an Grenzen stößt 2025

Video: COMPUTERWOCHE Round Table: Predictive Analytics - wo Mehrwert noch an Grenzen stößt 2025
Anonim

Wie bei vielen Aspekten eines Geschäftssystems sind Daten eine menschliche Schöpfung - daher ist es wahrscheinlich, dass die Benutzerfreundlichkeit eingeschränkt wird, wenn Sie zuerst erhalte es. Hier finden Sie eine Übersicht über einige Einschränkungen, denen Sie wahrscheinlich begegnen werden:

  • Die Daten können unvollständig sein. Fehlende Werte, selbst das Fehlen eines Abschnitts oder eines wesentlichen Teils der Daten, können die Benutzerfreundlichkeit einschränken.

    Zum Beispiel können Ihre Daten nur eine oder zwei Bedingungen einer größeren Menge abdecken, die Sie modellieren möchten - wie bei einem Modell zur Analyse der Aktienmarkt-Performance nur Daten aus den letzten 5 Jahren verfügbar sind, die beide verzerrt die Daten und das Modell zur Annahme eines Bullenmarktes.

    In dem Moment, in dem der Markt eine Korrektur erfährt, die zu einem Bärenmarkt führt, passt sich das Modell nicht an - einfach weil es nicht mit Daten, die einen Bärenmarkt darstellen, trainiert und getestet wurde.

    Stellen Sie sicher, dass Sie sich einen Zeitrahmen ansehen, der Ihnen ein vollständiges Bild der natürlichen Schwankungen Ihrer Daten vermittelt. Ihre Daten sollten nicht durch Saisonalität beschränkt sein.

  • Wenn Sie Daten aus Umfragen verwenden, denken Sie daran, dass Personen nicht immer genaue Informationen bereitstellen. Nicht jeder wird wahrheitsgemäß beantworten, wie oft er trainiert - oder wie viele alkoholische Getränke er konsumiert - pro Woche. Die Leute mögen nicht so unehrlich sein wie selbstbewusst, aber die Daten sind immer noch verzerrt.

  • Daten aus verschiedenen Quellen können in Qualität und Format variieren. Daten, die aus so unterschiedlichen Quellen wie Umfragen, E-Mails, Dateneingabeformularen und der Unternehmenswebsite gesammelt werden, haben unterschiedliche Attribute und Strukturen. Daten aus verschiedenen Quellen haben möglicherweise keine große Kompatibilität zwischen Datenfeldern. Solche Daten erfordern eine umfangreiche Vorverarbeitung, bevor sie analysefähig ist. Die beigefügte Seitenleiste enthält ein Beispiel.

Daten aus mehreren Quellen können Unterschiede in der Formatierung, doppelte Datensätze und Inkonsistenzen in zusammengeführten Datenfeldern aufweisen. Erwarten Sie eine lange Zeit damit, diese Daten zu säubern - und die Zuverlässigkeit noch länger zu bestätigen.

Um die Einschränkungen Ihrer Daten zu bestimmen, gehen Sie folgendermaßen vor:

  • Überprüfen Sie alle Variablen, die Sie in Ihrem Modell verwenden.

  • Bewerten Sie den Umfang der Daten, insbesondere im Laufe der Zeit, damit Ihr Modell die Saisonalitätsfalle vermeiden kann.

  • Überprüfen Sie fehlende Werte, identifizieren Sie sie und bewerten Sie ihre Auswirkungen auf die Gesamtanalyse.

  • Achten Sie auf Extremwerte (Ausreißer) und entscheiden Sie, ob diese in die Analyse einbezogen werden sollen.

  • Bestätigen Sie, dass der Pool von Trainings- und Testdaten groß genug ist.

  • Stellen Sie sicher, dass Datentyp (Ganzzahlen, Dezimalwerte oder Zeichen usw.) korrekt ist, und legen Sie die obere und untere Grenze der möglichen Werte fest.

  • Achten Sie besonders auf die Datenintegration, wenn Ihre Daten aus mehreren Quellen stammen.

Stellen Sie sicher, dass Sie Ihre Datenquellen und deren Auswirkungen auf die Gesamtqualität Ihrer Daten verstehen.

  • Wählen Sie einen relevanten Datensatz aus, der für die gesamte Population repräsentativ ist.

  • Wählen Sie die richtigen Parameter für Ihre Analyse aus.

Lassen Sie sich auch nach all dieser Sorgfalt und Aufmerksamkeit nicht wundern, wenn Ihre Daten noch Vorverarbeitung benötigen, bevor Sie sie genau analysieren können. Die Vorverarbeitung dauert oft lange und ist mit erheblichem Aufwand verbunden, da mehrere Probleme im Zusammenhang mit den Originaldaten angegangen werden müssen. Dazu gehören:

  • Alle Werte fehlen in den Daten.

  • In den Daten vorhandene Inkonsistenzen und / oder Fehler.

  • Alle Duplikate oder Ausreißer in den Daten.

  • Jede Normalisierung oder andere Transformation der Daten.

  • Alle abgeleiteten Daten, die für die Analyse benötigt werden.

Die Grenzen der Daten in Predictive Analytics - Dummies

Die Wahl des Herausgebers

Anzeigen von elektrischen Signalen an einem Oszilloskop - Dummies

Anzeigen von elektrischen Signalen an einem Oszilloskop - Dummies

Ein Oszilloskop ermöglicht das Anzeigen eines elektrischen Signals durch Anzeigen einer Spannung. variiert mit der Zeit als eine Spur über eine Anzeige. Die vertikale Achsenspannung zeigt die Größe der Spannung (auch Amplitude genannt) an, und die horizontale Achse repräsentiert die Zeit. (Denken Sie daran, Gleichungen in Mathematik-Klasse zu zeichnen? Nun, die Anzeige auf einem Bereich ist wirklich ...

Eintauchen in DX-ing - Dummies

Eintauchen in DX-ing - Dummies

Drücken Sie Ihre Station, um Kontakte über immer größere Entfernungen herzustellen (DX bedeutet entfernte Stationen ist die zweitälteste Aktivität im gesamten Amateurfunk. Irgendwo im Äther ist eine Station immer nur verlockend außer Reichweite und die Herausforderung, diese Station zu kontaktieren, ist der Zweck von DX-ing. Tausende von Schinken über ...

Steuern Sie Ihre Elektronik über einen Parallelport - Dummies

Steuern Sie Ihre Elektronik über einen Parallelport - Dummies

Werfen Sie nicht weg alter Computer! Wenn es einen Parallelport hat, können Sie damit Ihre elektronischen Gadgets steuern. Bis vor einigen Jahren waren alle Computer mit einem parallelen Anschluss ausgestattet, der hauptsächlich zum Anschluss an einen Drucker verwendet wurde. Heutzutage verbinden sich die meisten Drucker über USB-Ports mit Computern. Der Parallelport ...

Die Wahl des Herausgebers

Neuro-linguistisches Programmieren: Zu Deinem Selbst Selbst Seien Wahr - Attrappen

Neuro-linguistisches Programmieren: Zu Deinem Selbst Selbst Seien Wahr - Attrappen

Fahren nicht durch dein Leben mit einem Fuß auf der Bremse, weil du versuchst, den Erwartungen anderer Menschen gerecht zu werden. Persönliche Verantwortung und echtes Autofahren ist viel einfacher, wenn man versteht, wer man im Mittelpunkt steht und was man im Leben erreichen will. Sie können Maßnahmen ergreifen, wenn Sie ...

Bewegen Jenseits von Typ A: Abheben der Uhr - Dummies

Bewegen Jenseits von Typ A: Abheben der Uhr - Dummies

Typ A sind von der Zeit besessen. "Das nimmt zu viel Zeit in Anspruch" "Verdammt, es wird spät - ich werde nie pünktlich fertig sein." "Ich wünschte, sie würden sich beeilen. "Typ A hat ein beschleunigtes Zeitgefühl. Sie fühlen, wie die Zeit im Laufe des Tages immer mehr "abrutscht". Dies führt zu einem ...

Stimmung Störungen und ihre Behandlung Medikamente - Dummies

Stimmung Störungen und ihre Behandlung Medikamente - Dummies

Stimmungsstörungen, auch als affektive Störungen bekannt, sind eine Gruppe von Krankheiten gekennzeichnet durch eine deutliche Veränderung des emotionalen Zustandes einer Person. Die drei häufigsten Stimmungsstörungen sind bipolare Störung, Dysthymie und Major Depression. Stimmungsstörungen betreffen fast 21 Prozent der Erwachsenen in den Vereinigten Staaten. Die meisten Betroffenen finden jedoch ein gewisses Maß an ...

Die Wahl des Herausgebers

So ​​wählen Sie die von Ihnen benötigten AWS-Dienste aus - Attrappen

So ​​wählen Sie die von Ihnen benötigten AWS-Dienste aus - Attrappen

Denken Sie daran, dass Sie nur 12 Monate frei haben Entscheidungsprozess darüber, welche AWS-Dienste (Amazon Web Services) in Ihrem Unternehmen verwendet werden sollen. Zwölf Monate mögen sehr viel Zeit in Anspruch nehmen, aber Sie werden feststellen, dass es vor Ihren Augen verdunstet, wenn Sie versuchen, Ihre täglichen Aufgaben, Meetings, ... zu bewältigen.

Amazon Web Services für Dummies Cheat Sheet - Dummies

Amazon Web Services für Dummies Cheat Sheet - Dummies

Amazon Web Services (AWS) ist ein Cloud-Dienstanbieter, der bietet einfachen Zugriff auf eine Vielzahl von nützlichen Computerressourcen, die alle auf bedarfsgerechte, kosteneffiziente Weise angeboten werden. Wenn Sie ein IT-Praktiker sind, der bereit ist, Amazon Web Services zu nutzen, brechen Sie Ihre alten Anwendungsmuster-Gewohnheiten und implementieren Sie neue Ansätze, die AWS-Eigenschaften und ...

AWS-Sicherheitsprobleme - Dummies

AWS-Sicherheitsprobleme - Dummies

Für die Verwendung von AWS (Amazon Web Services) müssen Sie die Sicherheit Ihres Computers in einem Weg. Administratoren und Sicherheitsexperten können sich schnell verrückt machen, wenn sie versuchen, diese miteinander verbundenen Computer sicher zu halten, aber das ist Teil der Stellenbeschreibung. Sie müssen Best Practices bei der Sicherung der Computersysteme und der darin enthaltenen Daten befolgen.