Zuhause Persönliche Finanzen Vorbereiten von Daten für ein Predictive Analysis-Modell - Dummies

Vorbereiten von Daten für ein Predictive Analysis-Modell - Dummies

Inhaltsverzeichnis:

Video: Data Preparation in SAP Analytics Cloud 2025

Video: Data Preparation in SAP Analytics Cloud 2025
Anonim

Wenn Sie die Ziele des Modells für die vorausschauende Analyse definiert haben, müssen Sie im nächsten Schritt die Daten ermitteln und vorbereiten, die Sie zum Erstellen Ihres Modells verwenden. Die allgemeine Reihenfolge der Schritte sieht wie folgt aus:

  1. Identifizieren Sie Ihre Datenquellen.

    Daten können in verschiedenen Formaten vorliegen oder sich an verschiedenen Orten befinden.

  2. Identifizieren Sie, wie Sie auf diese Daten zugreifen werden.

    Manchmal müssen Sie Daten von Drittanbietern oder Daten anderer Abteilungen in Ihrer Organisation usw. erwerben.

  3. Überlegen Sie, welche Variablen in Ihre Analyse einbezogen werden sollen.

    Ein Standardansatz besteht darin, mit einem großen Bereich von Variablen zu beginnen und diejenigen zu eliminieren, die keine prädiktiven Werte für das Modell bieten.

  4. Bestimmen Sie, ob abgeleitete Variablen verwendet werden sollen.

    In vielen Fällen hätte eine abgeleitete Variable (wie z. B. das für die Analyse von Aktienkursen verwendete Preis-Leistungsverhältnis) eine größere direkte Auswirkung auf das Modell als die Rohvariable.

  5. Erkunden Sie die Qualität Ihrer Daten, um deren Zustand und Einschränkungen zu verstehen.

    Die Genauigkeit der Vorhersagen des Modells hängt direkt mit den von Ihnen ausgewählten Variablen und der Qualität Ihrer Daten zusammen. Sie möchten an dieser Stelle einige datenbezogene Fragen beantworten:

    • Sind die Daten vollständig?

    • Hat es irgendwelche Ausreißer?

    • Müssen die Daten bereinigt werden?

    • Müssen Sie fehlende Werte ausfüllen, behalten, wie sie sind, oder sie ganz löschen?

Wenn Sie Ihre Daten und ihre Eigenschaften verstehen, können Sie den Algorithmus auswählen, der beim Erstellen Ihres Modells am nützlichsten ist. Zum Beispiel:

  • Regressionsalgorithmen können verwendet werden, um Zeitreihendaten zu analysieren.

  • Klassifikationsalgorithmen können verwendet werden, um diskrete Daten zu analysieren.

  • Assoziationsalgorithmen können für Daten mit korrelierten Attributen verwendet werden.

Der zum Trainieren und Testen des Modells verwendete Datensatz muss relevante Geschäftsinformationen enthalten, um das Problem zu lösen, das Sie lösen möchten. Wenn es Ihr Ziel ist (zum Beispiel) zu bestimmen, welcher Kunde abwanderungsbereit ist, muss der Datensatz, den Sie auswählen, Informationen über Kunden enthalten, die in der Vergangenheit gewirkt haben, sowie Kunden, die dies nicht getan haben.

Einige Modelle, die erstellt wurden, um Daten zu extrahieren und die zugrundeliegenden Beziehungen zu verstehen - beispielsweise solche, die mit Clustering-Algorithmen erstellt wurden - müssen kein bestimmtes Endergebnis berücksichtigen.

Beim Umgang mit Daten entstehen beim Erstellen Ihres Modells zwei Probleme: Unteranpassung und Überanpassung.

Unterlegen

Unter Anpassung ist, wenn Ihr Modell keine Beziehungen in Ihren Daten erkennt.Dies ist normalerweise ein Hinweis darauf, dass wesentliche Variablen - solche mit Vorhersagekraft - nicht in Ihre Analyse einbezogen wurden. Zum Beispiel berücksichtigt eine Aktienanalyse, die nur Daten aus einem Bullenmarkt enthält (bei denen die Gesamtaktienkurse steigen) keine Krisen oder Blasen, die größere Korrekturen an der Gesamtperformance der Aktien bewirken können.

Wenn Daten, die sich sowohl auf Bullen als auch auf Baissemärkte (bei fallenden Gesamtaktienkursen) beziehen, nicht berücksichtigt werden, kann das Modell die bestmögliche Portfolioauswahl nicht erstellen.

Überanpassung

Überanpassung ist, wenn Ihr Modell Daten enthält, die keine Vorhersagekraft haben, aber nur für den Datensatz, den Sie analysieren, spezifisch ist. Rauschen - zufällige Variationen im Dataset - kann in das Modell einfließen, so dass das Ausführen des Modells in einem anderen Datensatz zu einem deutlichen Rückgang der Vorhersageleistung und -genauigkeit des Modells führt. Die beigefügte Seitenleiste enthält ein Beispiel.

Wenn Ihr Modell für ein bestimmtes Dataset fehlerfrei ist und nur eine Underperformance aufweist, wenn Sie es in einem anderen Dataset testen, sollten Sie eine Überanpassung vermuten.

Vorbereiten von Daten für ein Predictive Analysis-Modell - Dummies

Die Wahl des Herausgebers

ÜBen Mathe-Fragen für die Praxis: Sequenzen - Dummies

ÜBen Mathe-Fragen für die Praxis: Sequenzen - Dummies

Wenn Sie eine Frage zur Praxis Core-Prüfung beantworten Wenn Sie eine arithmetische oder geometrische Sequenz lösen müssen, denken Sie daran: Es geht darum, regelmäßige Muster zu finden - und manchmal rückwärts zu arbeiten. In den folgenden Übungsfragen fängst du damit an, einen bestimmten Begriff in einer Folge zu finden (einfach: suche einfach nach dem Unterschied zwischen jedem ...

ÜBen Mathematische Fragen für die Praxis: Ähnliche und kongruente Formen - Dummies

ÜBen Mathematische Fragen für die Praxis: Ähnliche und kongruente Formen - Dummies

Auch wenn zwei Formen aussehen identisch, können sie nicht sein. Zum Beispiel können Sie bei der Praxis Core-Prüfung auf eine Frage stoßen, bei der zwei Formen gleich aussehen, aber es wird Ihnen gesagt, sie seien "ähnlich". " Was bedeutet das? Was ist, wenn sie als "kongruent" gekennzeichnet sind? Wenn Sie sich nicht sicher sind, sollten die folgenden Übungsfragen (und ihre Erklärungen) ...

ÜBen Mathematische Fragen für die Praxis: Vereinfachen eines algebraischen Ausdrucks - Dummys

ÜBen Mathematische Fragen für die Praxis: Vereinfachen eines algebraischen Ausdrucks - Dummys

Einige algebraische Ausdrücke auf der Praxis Core Prüfung kann einschüchternd aussehen, und Sie können sogar auf sie aufgeben und weitermachen. Wie Sie in den folgenden Übungsfragen sehen werden, können Sie jedoch einige einfache Techniken verwenden, wie das Faktorisieren und Kombinieren von ähnlichen Begriffen, um sie zu lösen. Übungsfragen Welche der folgenden ist die vereinfachte ...

Die Wahl des Herausgebers

Fotografieren im Sportmodus mit einer Canon EOS Rebel T3-Kamera - Dummies

Fotografieren im Sportmodus mit einer Canon EOS Rebel T3-Kamera - Dummies

Der Sportmodus der Canon Rebel T3 und T3i führt zu einer Reihe von Einstellungen, mit denen Sie sich bewegende Motive fotografieren können. Zunächst wählt die Kamera eine kurze Verschlusszeit aus, die zum Stoppen der Bewegung benötigt wird. "Farben, Schärfe und Kontrast sind alle im Sportmodus Standard, wobei keine der Anpassungen im Portrait ...

Aufnahme von Bildern im Nahaufnahmemodus mit einer Canon EOS Rebel T3-Kamera

Aufnahme von Bildern im Nahaufnahmemodus mit einer Canon EOS Rebel T3-Kamera

Der Nahaufnahme-Modus der Canon Rebel T3 und T3i ermöglicht es Ihnen nicht, näher am Motiv zu fokussieren als bei einigen Nicht-Spiegelreflexkameras. Die Nahfokussierungsfähigkeiten Ihrer Kamera hängen ganz von der Linse ab, die Sie verwenden. (In der Bedienungsanleitung Ihres Objektivs sollte die minimale Fokussierentfernung angegeben werden.) Auswahl des Nahaufnahmemodus ...

Fotografieren im Querformat mit einer Canon EOS Rebel T3-Kamera - Dummies

Fotografieren im Querformat mit einer Canon EOS Rebel T3-Kamera - Dummies

Der Landschaftsmodus der Canon Rebel T3 und T3i, der für die Aufnahme von Aussichtspunkten, Stadtskylinen und anderen großformatigen Motiven konzipiert wurde, erzeugt eine große Schärfentiefe. Infolgedessen erscheinen Objekte, die sich sowohl in der Nähe der Kamera als auch in einiger Entfernung befinden, scharf fokussiert. Wie im Hochformat-Modus erreicht der Querformat-Modus die größere Schärfentiefe durch Manipulieren von ...

Die Wahl des Herausgebers

Erstellen und Verwenden von Verknüpfungen im dynamischen GP-Navigationsbereich - Dummies

Erstellen und Verwenden von Verknüpfungen im dynamischen GP-Navigationsbereich - Dummies

Microsoft Dynamics GP-Verknüpfungen werden angezeigt. Der obere Teil des Navigationsfensters, wenn Sie Ihre Dynamics GP Homepage anzeigen. Verwenden Sie Verknüpfungen, um häufig verwendete Fenster und Ressourcen in Dynamics GP schnell zu öffnen. Zum Beispiel können Sie einen Satz von Verknüpfungen zu den Fenstern erstellen, die Sie regelmäßig verwenden, und einen anderen Satz für die ...

MYOB Software für Dummies-Spickzettel (Neuseeland-Ausgabe) - Dummies

MYOB Software für Dummies-Spickzettel (Neuseeland-Ausgabe) - Dummies

Sie können MYOB verwenden für Ihre Geschäftsanforderungen schnell und einfach durch diese einfachen Verknüpfungen. Wenn Sie zusätzliche Hilfe benötigen, bieten viele Websites MYOB-Unterstützung an.

MYOB Software für Dummies Cheat Sheet (Australische Ausgabe) - Dummies

MYOB Software für Dummies Cheat Sheet (Australische Ausgabe) - Dummies

Mit MYOB für Ihre Unternehmensanforderungen kann durch diese einfachen Abkürzungen noch schneller und einfacher gemacht werden. Und wenn Sie Hilfe benötigen, gibt es viele Websites, die Unterstützung anbieten.