Video: Webinar: IoT Analytics Plattform für Sensordaten 2024
Verschiedene Algorithmen für Statistik, Data Mining und Maschinenlernen stehen für Ihr Predictive Analytics-Modell zur Verfügung. Sie sind in der Lage, einen Algorithmus auszuwählen, nachdem Sie die Ziele Ihres Modells definiert und die Daten ausgewählt haben, an denen Sie arbeiten werden. Einige dieser Algorithmen wurden entwickelt, um spezifische Geschäftsprobleme zu lösen, bestehende Algorithmen zu verbessern oder neue Funktionen bereitzustellen - was einige von ihnen für Ihre Zwecke besser geeignet macht als andere. Sie können aus einer Reihe von Algorithmen wählen, um Geschäftsanliegen wie die folgenden zu berücksichtigen:
- Für die Kundensegmentierung und / oder Community-Erkennung im sozialen Bereich benötigen Sie beispielsweise Clustering-Algorithmen.
- Zur Kundenbindung oder zur Entwicklung eines Empfehlungssystems würden Sie Klassifikationsalgorithmen verwenden.
- Für die Bewertung von Krediten oder die Vorhersage des nächsten Ergebnisses von zeitgesteuerten Ereignissen würden Sie einen Regressionsalgorithmus verwenden.
Da Zeit und Ressourcen es zulassen, sollten Sie so viele Algorithmen des entsprechenden Typs wie möglich ausführen. Der Vergleich verschiedener Läufe verschiedener Algorithmen kann zu überraschenden Ergebnissen über die in die Daten eingebetteten Daten oder Business Intelligence führen. Auf diese Weise erhalten Sie einen detaillierteren Einblick in das Geschäftsproblem und können ermitteln, welche Variablen in Ihren Daten vorhersagend sind.
Bei einigen Vorhersageanalysen ist es am besten, wenn Sie ein Ensemble-Modell erstellen, eine Gruppe von Modellen, die mit denselben Daten arbeiten. Ein Ensemblemodell verwendet einen vordefinierten Mechanismus, um Ergebnisse aus allen seinen Komponentenmodellen zu sammeln und ein endgültiges Ergebnis für den Benutzer bereitzustellen.
Modelle können verschiedene Formen annehmen - eine Abfrage, eine Sammlung von Szenarien, einen Entscheidungsbaum oder eine erweiterte mathematische Analyse. Darüber hinaus funktionieren bestimmte Modelle am besten für bestimmte Daten und Analysen. Sie können (zum Beispiel) Klassifikationsalgorithmen verwenden, die Entscheidungsregeln verwenden, um das Ergebnis eines bestimmten Szenarios oder einer bestimmten Transaktion zu bestimmen, wobei Fragen wie diese angesprochen werden:
- Reagiert dieser Kunde wahrscheinlich auf unsere Marketingkampagne?
- Ist diese Geldüberweisung wahrscheinlich Teil eines Geldwäscheprogramms?
- Ist dieser Darlehensantragsteller wahrscheinlich mit dem Darlehen in Verzug?
Sie können unbeaufsichtigte Clustering-Algorithmen verwenden, um zu ermitteln, welche Beziehungen in Ihrem Dataset vorhanden sind. Mithilfe dieser Algorithmen können Sie verschiedene Gruppierungen bei Ihren Kunden finden, bestimmen, welche Services zusammengefasst werden können, oder beispielsweise entscheiden, welche Produkte hochgeladen werden können.
Regressionsalgorithmen können verwendet werden, um fortlaufende Daten zu prognostizieren, z. B. um den Trend für eine Bestandsbewegung aufgrund ihrer vergangenen Preise vorherzusagen.
Entscheidungsbäume, Support-Vektor-Maschinen, neuronale Netze, logistische und lineare Regressionen sind einige der gebräuchlichsten Algorithmen. Obwohl sich ihre mathematischen Implementierungen unterscheiden, erzeugen diese Vorhersagemodelle vergleichbare Ergebnisse. Die Entscheidungsbäume sind beliebter, weil sie leicht zu verstehen sind. Sie können den Weg zu einer bestimmten Entscheidung verfolgen.
Klassifizierungsalgorithmen eignen sich hervorragend für die Art der Analyse, wenn das Ziel bekannt ist (z. B. das Identifizieren von Spam-E-Mails). Auf der anderen Seite sind Clustering-Algorithmen die beste Wahl, wenn die Zielvariable unbekannt ist. Sie ermöglichen es Ihnen, Ihre Daten anhand der Ähnlichkeiten zwischen den Gruppenmitgliedern in sinnvolle Gruppen zu gruppieren oder zu gruppieren.
Diese Algorithmen sind weit verbreitet. Es gibt viele kommerzielle und Open-Source-Tools, die sie implementieren. Mit zunehmender Datenakkumulation und -beschleunigung (dh Big Data) und kosteneffizienter Hardware und Plattformen (wie Cloud Computing und Hadoop) erleben Predictive Analytics-Tools einen Boom.
Daten und Geschäftsziele sind nicht die einzigen Faktoren, die berücksichtigt werden müssen, wenn Sie einen Algorithmus auswählen. Das Fachwissen Ihrer Data Scientists ist an dieser Stelle von enormem Wert; Die Auswahl eines Algorithmus, der die Arbeit erledigt, ist oft eine knifflige Kombination aus Wissenschaft und Kunst. Der Kunstteil stammt aus Erfahrung und Kompetenz im Geschäftsbereich, der auch eine entscheidende Rolle bei der Identifizierung eines Modells spielt, das Geschäftsziele genau erfüllen kann.