Verwendung von Big Data Analytics zur Steigerung der Kundentreue - Dummies
Sobald Sie Ihre Big Data gesammelt haben , was ist dein nächster Schritt? Heutzutage ist die Kundenbindung von größter Wichtigkeit, da sich der Kunde auf dem Weg zum Anbieter befindet, wenn es darum geht, eine Wahl zu treffen, wie er mit einem Dienstanbieter interagieren soll. Das gilt für viele Branchen. Der Käufer hat viel mehr Kanaloptionen und wird zunehmend ...
Wie man komplexe Ereignisverarbeitung für große Daten verwendet - Dummies
Komplexe Ereignisverarbeitung (CEP) ist nützlich für Big Data, da es beabsichtigt ist, Daten in Bewegung zu verwalten. Komplexe Ereignisverarbeitung ist eine Technik zum Verfolgen, Analysieren und Verarbeiten von Daten, wenn ein Ereignis eintritt. Diese Informationen werden dann basierend auf Geschäftsregeln und -prozessen verarbeitet und kommuniziert. Die Idee hinter CEP ist, in der Lage zu sein, ...
Verwendung von Apache Hadoop für Predictive Analytics - Dummies
Apache Hadoop ist eine kostenlose Open-Source-Software Plattform zum Schreiben und Ausführen von Anwendungen, die eine große Datenmenge für vorausschauende Analysen verarbeiten. Es ermöglicht eine verteilte parallele Verarbeitung großer Datenmengen, die aus verschiedenen Quellen erzeugt werden. Im Wesentlichen ist es ein leistungsfähiges Werkzeug zum Speichern und Verarbeiten von Big Data. Hadoop speichert jede Art von Daten, strukturiert oder ...
Verwendung von Kurvenanpassung in Predictive Analytics - Kurvenanpassung von Dummies
Ist ein Prozess, der in Predictive Analytics in Ziel ist es, eine Kurve zu erstellen, die die mathematische Funktion darstellt, die am besten zu den tatsächlichen (ursprünglichen) Datenpunkten in einer Datenreihe passt. Die Kurve kann entweder durch jeden Datenpunkt gehen oder innerhalb der Masse der Daten bleiben, wobei einige Daten ignoriert werden.
Wie man Data Streaming für Big Data nutzt - Dummies
Manchmal, wenn man sich Big Data nähert mit riesigen Datenmengen und wenig Ahnung, wo es weitergehen soll. Datenstreaming eingeben Wenn eine große Menge an Daten schnell und nahezu in Echtzeit verarbeitet werden muss, um Erkenntnisse zu gewinnen, sind Daten in Bewegung in Form von Streaming-Daten die beste Antwort. ...
Wie man Predictive Analysis Decision Trees benutzt, um die Zukunft vorherzusagen - Dummies
Ein Entscheidungsbaum ist ein Ansatz zur Vorhersageanalyse, der Ihnen bei Entscheidungen helfen kann. Nehmen Sie zum Beispiel an, Sie müssen sich entscheiden, ob Sie eine bestimmte Geldsumme in eines von drei Geschäftsprojekten investieren wollen: ein Lebensmittelgeschäft, ein Restaurant oder einen Buchladen. Ein Business Analyst hat die Ausfallrate ermittelt ...
Verwendung Item-basierter kollaborativer Filter in der Predictive Analysis - Dummies
Einer Empfehlung von Amazon Systeme zur Vorhersageanalyse verwenden eine auf Elementen basierende kollaborative Filterung - wobei ein großer Bestand an Produkten aus der Unternehmensdatenbank ausgegeben wird, wenn ein Benutzer einen einzelnen Artikel auf der Website betrachtet. Sie wissen, dass Sie ein kollaboratives Filtersystem auf Artikelbasis (oder oft ein inhaltsbasiertes System) suchen, wenn es Ihnen Empfehlungen bei ...
Verwendung von Datenglättung in Predictive Analytics - Dummies
Datenglättung in Predictive Analytics ist im Wesentlichen um das "Signal" in dem "Rauschen" zu finden, indem Datenpunkte verworfen werden, die als "verrauscht" betrachtet werden. Die Idee besteht darin, die Muster in den Daten zu schärfen und Trends hervorzuheben, auf die die Daten verweisen. Die Datenglättung hat zur Folge, dass die Daten aus zwei Teilen bestehen: Einer ...
Verwendung von Supervised Analytics zum Trainieren von Predictive Models - Dummies
In überwachten Analysen, sowohl Eingabe als auch bevorzugte Ausgang sind Teil der Trainingsdaten. Das Vorhersageanalysemodell wird im Rahmen seines Lernprozesses mit den richtigen Ergebnissen präsentiert. Solches überwachtes Lernen geht von vorklassifizierten Beispielen aus: Das Ziel besteht darin, das Modell aus der zuvor bekannten Klassifikation lernen zu lassen, damit es die ...
Wie man Apache Mahout für Predictive Analytics verwendet - Dummies
Ein Open-Source-Tool, das einzigartig nützlich ist in Predictive Analytics ist Apache Mahout. Diese Machine-Learning-Bibliothek enthält umfangreiche Versionen der Clustering-, Klassifizierungs-, kollaborativen Filter- und anderer Data-Mining-Algorithmen, die ein umfangreiches Vorhersageanalysemodell unterstützen können. Eine sehr empfehlenswerte Methode zur Verarbeitung der Daten, die für ein solches Modell benötigt werden, ist die Ausführung von Mahout in ...
Verwendung linearer Regressionen in Predictive Analytics - Dummies
Lineare Regression ist eine statistische Methode, die analysiert und findet Beziehungen zwischen zwei Variablen. In der Vorhersageanalyse kann es verwendet werden, um einen zukünftigen numerischen Wert einer Variablen vorherzusagen. Betrachten wir ein Beispiel für Daten, die zwei Variablen enthalten: frühere Daten, die aus den Ankunftszeiten eines Zuges und seiner entsprechenden Verzögerungszeit bestehen. Angenommen ...
Verwendung von Predictive Analytics zur Kundenzufriedenheit - Dummies
Globaler Wettbewerb treibt Unternehmen zu niedrigeren Preisen, um neue Kunden anzuziehen Kunden. Zum Glück kann hier eine vorausschauende Analyse helfen. Unternehmen bemühen sich, ihre Kunden zufrieden zu stellen und neue zu gewinnen. Kunden fordern zunehmend hochwertige Produkte zu günstigeren Preisen. Als Reaktion auf diesen Druck bemühen sich die Unternehmen, zur richtigen Zeit die richtige Balance zwischen Qualität und Preis zu liefern, ...
Verwendung von K-Means-Cluster-Algorithmen in der Predictive Analysis - Dummies
K ist ein Input auf den Algorithmus für die Vorhersageanalyse; Sie steht für die Anzahl der Gruppierungen, die der Algorithmus aus einem Datensatz extrahieren muss, algebraisch ausgedrückt als k. Ein K-Means-Algorithmus teilt einen gegebenen Datensatz in k Cluster auf. Der Algorithmus führt die folgenden Operationen durch: Wählen Sie k zufällige Elemente aus dem Datensatz aus und beschriften Sie sie ...
Wie man Python benutzt, um Graphen für Data Science zu entwickeln - Dummies
Graphen sind nützlich für Datenwissenschaftler .. Ein Graph ist eine Darstellung von Daten, die die Verbindungen zwischen Datenpunkten unter Verwendung von Linien in Pythopn zeigen. Der Zweck besteht darin, zu zeigen, dass sich einige Datenpunkte auf andere Datenpunkte beziehen, jedoch nicht auf alle Datenpunkte, die im Diagramm erscheinen. Denken Sie an eine Karte einer U-Bahn ...
Verwendung des Markov-Modells in Predictive Analytics - Dummies
Das Markov-Modell ist ein statistisches Modell, das kann in der vorausschauenden Analyse verwendet werden, die stark auf der Wahrscheinlichkeitstheorie beruht. (Es wurde nach einem russischen Mathematiker benannt, dessen primäre Forschung in der Wahrscheinlichkeitstheorie war.) Hier ist ein praktisches Szenario, das zeigt, wie es funktioniert: Stellen Sie sich vor, Sie möchten vorhersagen, ob Team X das morgige Spiel gewinnen wird. Das ...
Wie man Python benutzt, um die richtigen Variablen für Data Science auszuwählen - Dummies
Rechte Variablen in Python können den Lernprozess in der Datenwissenschaft verbessern, indem sie die Menge an Rauschen (nutzlose Informationen) reduzieren, die die Schätzungen des Lernenden beeinflussen können. Die variable Auswahl kann daher die Varianz von Vorhersagen effektiv reduzieren. Um nur die nützlichen Variablen in das Training einzubeziehen und die redundanten auszulassen, können Sie ...
Visualisierung der analytischen Ergebnisse Ihres Modells: Versteckte Gruppierungen, Datenklassifizierungen und Ausreißer - Attrappen Die
Visualisierung der Ergebnisse Ihrer Vorhersageanalyse hilft den Beteiligten, die nächsten Schritte zu verstehen. Hier sind einige Möglichkeiten, Visualisierungstechniken zu verwenden, um die Ergebnisse Ihrer Modelle den Stakeholdern zu melden. So visualisieren Sie versteckte Gruppierungen in Ihren Daten Bei der Datengruppierung handelt es sich um den Prozess, verborgene Gruppen verwandter Elemente innerhalb von ...
Visualisierung von Predictive Analysis' Rohdaten - Dummies
Ein Bild sagt mehr als tausend Worte - besonders wenn Sie versuchen, Ihre Vorhersageanalysedaten in den Griff zu bekommen. Beim Vorbereitungsschritt, während Sie Ihre Daten vorbereiten, ist es eine gängige Praxis, sich vorzustellen, was Sie in der Hand haben, bevor Sie mit dem nächsten Schritt fortfahren. Sie beginnen mit einer Tabellenkalkulation wie ...
Identifizierung fehlender Daten für maschinelles Lernen - Dummies
Selbst wenn Sie genügend Beispiele für einfache und komplexe Schulungen zur Hand haben Algorithmen zum maschinellen Lernen müssen vollständige Werte in den Features ohne fehlende Daten präsentieren. Ein unvollständiges Beispiel macht das Verbinden aller Signale innerhalb und zwischen Merkmalen unmöglich. Fehlende Werte erschweren es dem Algorithmus auch, während ...
Mit den Grundlagen von Statistik, maschinellem Lernen und mathematischen Methoden in der Datenwissenschaft - Dummies
Wenn die Statistik als die Wissenschaft beschrieben wird, Erkenntnisse aus Daten abzuleiten, was ist dann der Unterschied zwischen einem Statistiker und einem Datenwissenschaftler? Gute Frage! Während viele Aufgaben in der Datenwissenschaft ein angemessenes statistisches Know-how erfordern, unterscheidet sich der Umfang und die Breite der Kenntnisse und Fähigkeiten eines Datenwissenschaftlers von ...
Sensibilisierung der Daten für E-Commerce Wachstum - Dummies
Data Science im E-Commerce dient der Der gleiche Zweck wie in jeder anderen Disziplin - um wertvolle Erkenntnisse aus Rohdaten zu gewinnen. Im E-Commerce suchen Sie nach Dateneinblicken, mit denen Sie den ROI (Marketing Return on Investment) einer Marke optimieren und das Wachstum in jeder Ebene des Verkaufstrichters fördern können. Wie ...
Machine Lernen: Erstellen eigener Features in Daten - dummies
Manchmal die Rohdaten, die Sie von verschiedenen Quellen verfügen nicht über die Funktionen, die zum Ausführen von Aufgaben des maschinellen Lernens erforderlich sind. In diesem Fall müssen Sie eigene Features erstellen, um das gewünschte Ergebnis zu erzielen. Ein Feature zu erstellen bedeutet nicht, Daten aus dem Nichts zu erzeugen. Sie erstellen neue Features aus vorhandenen Daten. Den Bedarf verstehen ...
Positive Auswirkungen mit Environmental Intelligence erzielen - Dummies
Elva ist ein leuchtendes Beispiel dafür, wie Umweltintelligenz-Technologien eingesetzt werden können einen positiven Einfluss haben. Diese kostenlose, Open-Source-Plattform ermöglicht Ursachenmapping und Datenvisualisierung für Wahlbeobachtung, Menschenrechtsverletzungen, Umweltzerstörung und Katastrophenrisiko in Entwicklungsländern. In einem seiner neueren Projekte arbeitet Elva mit ...
Modellierung der Reisedauer in kriminellen Aktivitäten - Attrappen
Die Modellierung der Reisedauer krimineller Aktivitäten ermöglicht es Ihnen, die Reisemuster von Kriminellen, damit die Strafverfolgungsbehörden diese Informationen bei der taktischen Reaktionsplanung nutzen können. Wenn Sie die wahrscheinlichsten Routen vorhersagen wollen, die Kriminelle zwischen den Orten, von denen aus sie starten, und den Orten, an denen sie anfangen, erstellen.
Mathematische Modellierung mit Markov-Ketten und stochastischen Methoden - Dummies
Ein stochastisches Modell ist ein Werkzeug, das Sie verwenden können um mögliche Ergebnisse zu schätzen, wenn eine oder mehrere Modellvariablen zufällig geändert werden. Eine Markov-Kette - auch diskrete Markov-Kette genannt - ist ein stochastischer Prozess, der als mathematische Methode dient, um eine Reihe von zufällig generierten Variablen zu verketten, die ...
Mining Ihrer Daten mit Data Science - Dummies
Im Zeitalter der Big Data scheint es Organisationen aller Art zu sein und Größen sind auf einer anwerbenden Suche. Sie wollen Datenwissenschaftler einstellen, damit sie Daten und datenbasierte Entscheidungen nutzen können, um ihrer Organisation einen Mehrwert zu verleihen und wettbewerbsfähig zu bleiben. Unglücklicherweise verstehen die meisten Organisationen und ihre Personalverantwortlichen nicht wirklich ...
Fehlende Werte in Ihren Daten - Dummys
Eines der häufigsten und am schwersten zu bewältigenden Datenprobleme sind fehlende Daten. Dateien können unvollständig sein, weil Datensätze gelöscht wurden oder ein Speichergerät voll ist. Oder bestimmte Datenfelder enthalten möglicherweise keine Daten für einige Datensätze. Das erste dieser Probleme kann diagnostiziert werden, indem einfach die Anzahl der Datensätze für Dateien überprüft wird. ...
Neue Arbeitsmöglichkeiten mit maschinellem Lernen - Dummies
Sie können mehr als nur einige Artikel finden, die den Verlust von Jobs besprechen das maschinelle Lernen und die damit verbundenen Technologien verursachen. Roboter führen bereits eine Reihe von Aufgaben aus, die früher Menschen beschäftigten, und diese Nutzung wird mit der Zeit zunehmen. Sie müssen auch bedacht haben, wie diese neuen Anwendungen Sie möglicherweise kosten könnten ...
Phasen des Data Mining Prozesses - Dummys
Der branchenübergreifende Standardprozess für Data Mining (CRISP-DM) ist das vorherrschende Data-Mining-Prozess-Framework. Es ist ein offener Standard; Jeder kann es benutzen. Die folgende Liste beschreibt die verschiedenen Phasen des Prozesses. Business-Verständnis: Verschaffen Sie sich ein klares Verständnis für das Problem, das Sie lösen möchten, wie sich dies auf Ihre Organisation auswirkt, und Ihre Ziele für die Adressierung ...
Optimieren der Kreuzvalidierungsmöglichkeiten beim maschinellen Lernen - Dummys
Können eine maschinelle Lernhypothese effektiv validieren weitere Optimierung Ihres gewählten Algorithmus. Der Algorithmus liefert den größten Teil der Vorhersageleistung für Ihre Daten, da er Signale aus Daten erkennen und die wahre funktionale Form der Vorhersagefunktion ohne Überanpassung und große Varianz der Schätzungen erfüllen kann. Nicht ...
Neuartige Visualisierung in Predictive Analytics - Dummies
Eine Visualisierung kann eine Simulation darstellen (eine bildliche Darstellung eines Was-wäre-wenn-Szenarios) ) in der vorausschauenden Analytik. Sie können eine Visualisierung einer Vorhersage mit einer Simulation verfolgen, die sich überlappt und die Vorhersage unterstützt. Was geschieht zum Beispiel, wenn das Unternehmen die Produktion von Produkt D aufhört? Was passiert, wenn eine Naturkatastrophe das Home Office trifft? ...
Vorhersageanalyse: Wann Sie Ihr Modell aktualisieren müssen - Attrappen
So viel, wie Sie es vielleicht nicht mögen ist Ihr Predictive Analytics-Job noch nicht zu Ende, wenn Ihr Modell live geschaltet wird. Ein erfolgreicher Einsatz des Modells in der Produktion ist keine Zeit zum Entspannen. Sie müssen seine Genauigkeit und Leistung im Laufe der Zeit genau überwachen. Ein Modell tendiert dazu, sich im Laufe der Zeit zu verschlechtern (einige schneller als andere); und ...
Prädiktive räumliche Modelle für Kriminalitätsanalysen - Dummies
Sie können prädiktive statistische Modelle in Kriminalanalyse-Methoden integrieren, um Analysen zu erstellen, die beschreiben und vorhersagen, wo und welche Arten von kriminellen Aktivitäten wahrscheinlich vorkommen werden. Vorhersagbare räumliche Modelle können Ihnen helfen, das Verhalten, den Ort oder die kriminellen Aktivitäten von Wiederholungstäter vorherzusagen. Sie können auch statistische Methoden auf raumzeitliche Daten anwenden, um festzustellen, ob ...
Vorhersagende Analyse für Dummies Cheat Sheet - Dummies
Ein Predictive Analytics-Projekt kombiniert die Ausführung von Details mit einem großen Bild. Diese praktischen Tipps und Checklisten helfen Ihnen dabei, Ihr Projekt auf den Schienen und aus dem Wald heraus zu halten.
Vorbereiten der Daten für Predictive Analytics - Dummies
Wenn Sie die Ziele des Modells definiert haben, ist der nächste Schritt Bei der vorausschauenden Analyse werden die Daten identifiziert und vorbereitet, mit denen Sie Ihr Modell erstellen. Die folgenden Informationen betreffen die wichtigsten Aktivitäten. Die allgemeine Reihenfolge der Schritte sieht folgendermaßen aus: Identifizieren Sie Ihre Datenquellen. Daten können in verschiedenen Formaten vorliegen oder ...
Wahrscheinlichkeitsverteilungen in der statistischen Analyse von Big Data - Dummies
Wahrscheinlichkeitsverteilungen ist eine von vielen statistischen Techniken, die verwendet werden, um Daten zu analysieren, um nützliche Muster zu finden. Sie verwenden eine Wahrscheinlichkeitsverteilung, um die Wahrscheinlichkeiten zu berechnen, die den Elementen eines Datasets zugeordnet sind: Binomialverteilung: Sie würden die Binomialverteilung verwenden, um Variablen zu analysieren, die nur einen von zwei Werten annehmen können. Für ...
Quandl Open Data - dummies
Quandl ist eine Website mit Sitz in Toronto, die als Suchmaschine für numerische Daten dienen soll. Im Gegensatz zu den meisten Suchmaschinen wird die Datenbank jedoch nicht automatisch von Spidern erzeugt, die das Web crawlen. Es konzentriert sich vielmehr auf verknüpfte Daten, die über Crowdsourcing aktualisiert werden - mit anderen Worten, manuell über menschliche Kuratoren aktualisiert. Da die meisten Finanzdaten sind ...
Data Privacy Disasters verhindern - Dummies
Datenschutz ist ein großes Problem für Data Miner. Nachrichtenberichte, in denen der Umfang der personenbezogenen Daten in den Händen der Nationalen Sicherheitsagentur der US-Regierung und Verstöße gegen kommerzielle Datenquellen dargelegt werden, haben das öffentliche Bewusstsein und die Besorgnis geweckt. Ein zentrales Konzept des Datenschutzes sind personenbezogene Daten (PII) oder Daten, die ...
Der Aufstieg offener Daten und ihre Rolle in Predictive Analytics - Dummies
Open Daten könnten werden ein sehr nützliches Tool für Predictive Analytics. Bob Lytle, der CEO von rel8ed. und, zuletzt bekannt als ehemaliger CIO von TransUnion Canada, ist führend in der Nutzung öffentlicher Informationen als alternative und strategische Datenquelle für die Vorhersagemodellierung im Finanzdienstleistungs- und Versicherungssektor. Open ...
Quantitative explorative Datenanalyse (EDA) Techniken - Dummies
Obwohl EDA hauptsächlich auf grafischen besteht auch aus einigen quantitativen Techniken. Dieser Artikel beschreibt zwei davon: Intervallschätzung und Hypothesentest. Intervallschätzung Die Intervallschätzung ist eine Technik, die verwendet wird, um einen Bereich von Werten zu konstruieren, innerhalb dessen eine Variable wahrscheinlich fällt. Ein wichtiges Beispiel dafür ...