Daten verfügbar Über Consumer Data hinaus - Dummies
Nicht alle Daten, die Sie benötigen, beziehen sich auf Personen. Vielleicht interessieren Sie sich mehr für Unternehmen oder gemeinnützige Organisationen. Vielleicht haben Sie Interesse an Gewittern, Ananas oder Brücken. Kein Problem. Kommerzielle Quellen können Daten für all diese Dinge und viele mehr liefern. Wenn Daten verfügbar sind, die Sie genug schätzen, um zu bezahlen ...
Columnare Daten in NoSQL - Dummys
Spaltenspeicher in NoSQL ähneln beim ersten Erscheinen traditionellen relationalen DBMS. Die Konzepte von Zeilen und Spalten sind immer noch da. Sie definieren auch Spaltenfamilien vor dem Laden von Daten in die Datenbank, was bedeutet, dass die Struktur der Daten im Voraus bekannt sein muss. Spaltenspeicher organisieren jedoch Daten anders als relationale Datenbanken. Stattdessen ...
Daten Aggregation - Dummies
Daten zusammenzufassen, Summen zu ermitteln und Durchschnittswerte und andere beschreibende Maßnahmen zu berechnen, ist Ihnen wahrscheinlich nicht neu. Wenn Sie Ihre Zusammenfassungen nicht in Form von Berichten, sondern in Form von neuen Daten benötigen, wird der Vorgang Aggregation genannt. Aggregierte Daten können zur Grundlage für zusätzliche Berechnungen werden, die mit anderen Datensätzen zusammengeführt werden und auf andere Weise verwendet werden können.
Clustering Soziale Netzwerke in Gruppen - Dummies
Menschen neigen dazu, Gemeinschaften zu bilden - Cluster von anderen Menschen, die Ideen und Gefühle haben .. Durch die Untersuchung dieser Cluster wird es einfacher, bestimmte Verhaltensweisen der Gruppe insgesamt zuzuordnen (obwohl die Zuordnung des Verhaltens zu einem Individuum sowohl gefährlich als auch unzuverlässig ist). Die Idee hinter dem Studium von Clustern ist, dass, wenn eine Verbindung ...
Data Mining Testing Online - Dummies
Online-Umgebungen bieten Data Minern eine einzigartige Mischung aus Herausforderungen und Vorteilen für die Datenerfassung und -analyse .. Hier ist die schlechte Nachricht: Web-Datenformate können in Data-Mining-Anwendungen schwer zu importieren und zu manipulieren sein. Systeme, die Webseiten bedienen, sind oft schlecht in Verkaufsverfolgungssysteme integriert, was es schwierig macht, Verbindungen zwischen ...
Datenbanken und Data Mining - Dummies
Daten, die von großen Organisationen im Tagesgeschäft gesammelt werden, werden üblicherweise in Datenbanken gespeichert. Aber Datenbankadministratoren sind möglicherweise nicht bereit, Data Minern direkten Zugriff auf diese Datenquellen zu gewähren, und der direkte Zugriff ist aus Ihrer Sicht möglicherweise auch nicht die beste Option. Direkter Zugang zum Betrieb (wird routinemäßig verwendet ...
Verbraucherdaten für Data Miner - Dummies
Zur Einführung in die Verbraucherinformationen, die über kommerzielle Anbieter verfügbar sind. Schauen Sie sich ein detailliertes Beispiel an. Die Tabelle enthält alle Daten, die von Axciom, einem großen Anbieter von Verbraucher-Marketingdaten, über einen Verbraucher gesammelt wurden. Dieser Anbieter stellt Marketingdaten über einzelne Verbraucher und die Haushalte, in denen diese Verbraucher leben, wie folgt bereit: ...
Datenmanagement für Big Data - Dummies
Sind Big Data wirklich neu oder ist es eine Evolution in der Datenmanagement-Reise? Es ist eigentlich beides. Wie bei anderen Wellen im Datenmanagement basieren Big Data auf der Evolution der Datenmanagementpraktiken in den letzten fünf Jahrzehnten. Neu ist, dass zum ersten Mal die Kosten ...
10 Häufige Data Mining Fehler (die Sie nicht machen werden) - Dummies
Data Mining wird durch Versuch und Irrtum durchgeführt, und daher ist es für Data Miner nur natürlich, Fehler zu machen. Fehler können, zumindest unter bestimmten Bedingungen, wertvoll sein. Nicht alle Fehler sind jedoch gleich. Einige sind einfach besser vermieden. Die folgende Liste bietet zehn solche Fehler. Wenn Sie sie sorgfältig durchlesen, ...
Data Mining maximiert die Gewinne von Warehouse Clubs - Dummies
Vielleicht haben Sie bei einem der Lagerhäuser, Einzelhandelsketten eingekauft Diese bieten Mitgliedern nur in großen Läden ohne Schnickschnack einkaufen. Lagerhallen haben bloße Betonböden, einfache funktionale Regale und eine begrenzte Auswahl an Produkten und Verpackungsgrößen. Ihre Check-Out-Bahnen bieten keine Taschen, geschweige denn Bagger, um Ihre Einkäufe einzupacken. Warehouse Clubs setzen ...
Datenschutzoptionen für Big Data - Dummies
Einige Big-Data-Experten sind der Meinung, dass verschiedene Arten von Daten unterschiedliche Formen von Daten erfordern. Schutz und dass, in einigen Fällen in einer Cloud-Umgebung, Datenverschlüsselung in der Tat übertrieben sein kann. Sie könnten alles verschlüsseln. Sie könnten Daten beispielsweise verschlüsseln, wenn Sie sie auf Ihre eigene Festplatte schreiben, wenn Sie sie an ...
Gemeinsame Features von NoSQL - Dummies
NoSQL-Bücher und Blogs bieten unterschiedliche Meinungen darüber, was eine NoSQL-Datenbank ist. Vier Kernfeatures von NoSQL, die in der folgenden Liste aufgeführt sind, gelten für die meisten NoSQL-Datenbanken. Die Liste vergleicht NoSQL mit dem herkömmlichen relationalen DBMS: Schema-unabhängig: Ein Datenbankschema ist die Beschreibung aller möglichen Daten- und Datenstrukturen in einer relationalen Datenbank. ...
Sind die Elemente im Datensatz unkorreliert? - Dummies
Für einen Datensatz, der aus Beobachtungen besteht, die zu unterschiedlichen Zeitpunkten gemacht wurden (dh Zeitreihendaten), ist es wichtig zu bestimmen, ob die Beobachtungen miteinander korreliert sind oder nicht. Dies liegt daran, dass viele Techniken zur Modellierung von Zeitreihendaten auf der Annahme basieren, dass die Daten miteinander unkorreliert sind ...
3 Arten von maschinellem Lernen - Dummies
Maschinelles Lernen kommt in vielen verschiedenen Varianten vor, abhängig vom Algorithmus und seinen Zielen. Sie können maschinelle Lernalgorithmen in drei Hauptgruppen aufteilen, die auf ihrem Zweck basieren: Überwachtes Lernen Nicht überwachtes Lernen Verstärkungslernen Überwachtes Lernen Überwachtes Lernen findet statt, wenn ein Algorithmus aus Beispieldaten und zugehörigen Zielantworten lernt, die aus numerischen ...
Grundlagen von Klassifikationsmodellen für analytische Vorhersagen - Dummies
Sobald Sie alle notwendigen Werkzeuge und Daten zur Verfügung haben ein Vorhersagemodell, beginnt der Spaß. Im Allgemeinen umfasst das Erstellen eines Lernmodells für Klassifizierungsaufgaben die folgenden Schritte: Laden Sie die Daten. Wählen Sie einen Klassifikator aus. Trainiere das Modell. Visualisieren Sie das Modell. Testen Sie das Modell. Bewerten Sie das Modell. Sowohl die logistische Regression als auch ...
Anwendung der Hauptkomponentenanalyse auf Predictive Analytics - Dummies
Hauptkomponentenanalyse (PCA) ist eine wertvolle Technik, die weit verbreitet in Predictive Analytics und Data Science. Es untersucht einen Datensatz, um die relevantesten Variablen zu ermitteln, die für die größte Variation in diesem Datensatz verantwortlich sind. PCA wird meist als Datenreduktionstechnik eingesetzt. Beim Erstellen von Vorhersagemodellen müssen Sie möglicherweise die ...
10 Wichtige Data Science Resource Collections zur Verwendung mit Python - Dummies
Es gibt wirklich eine Tonne Informationen, die dort für Datenwissenschaftler verfügbar sind, die Python verwenden. Diese Informationen führen Sie in eine Fülle von Data Science Resource Collections ein, die Sie wirklich kennen müssen. Gewinnen Sie Einblicke mit Data Science Weekly Die Data Science Weekly ist ein kostenloser Newsletter, den Sie abonnieren können, um zu erhalten ...
8 Best Practices in der Datenaufbereitung - Dummies
Statistische Softwarepakete sind heutzutage extrem mächtig, aber sie können arme Qualitätsdaten. Im Folgenden finden Sie eine Checkliste der Dinge, die Sie tun müssen, bevor Sie statistische Modelle erstellen. Datenformate prüfen Ihre Analyse beginnt immer mit einer Rohdatendatei. Rohdatendateien gibt es in vielen verschiedenen Formen und Größen. Mainframe ...
Vermeidung von Sample-Bias und Leckagefallen im maschinellen Lernen - Dummies
Der Validierungsansatz für maschinelles Lernen ist ein Prüfung eines möglichen Rechtsbehelfs auf In-Sampling-Bias. Ein In-Sampling-Bias kann Ihren Daten zustoßen, bevor maschinelles Lernen in die Tat umgesetzt wird, und verursacht eine hohe Varianz der folgenden Schätzungen. Darüber hinaus sollten Sie sich der Leckagefallen bewusst sein, die auftreten können, wenn einige Informationen aus ...
Autokorrelationsdiagramme: Grafische Technik für statistische Daten - Dummies
Ein Autokorrelationsdiagramm zeigt die Eigenschaften eines Typs von Daten bekannt als eine Zeitreihe. Eine Zeitreihe bezieht sich auf Beobachtungen einer einzelnen Variablen über einen bestimmten Zeithorizont. Zum Beispiel ist der Tageskurs der Microsoft Aktie im Jahr 2013 eine Zeitreihe. Querschnittsdaten beziehen sich auf Beobachtungen an vielen Variablen ...
10 Freie Ressourcen für Data Science - Dummies
Eine ausgezeichnete Sache über Data Science ist, dass Sie nicht brauchen viel Geld für Softwareanwendungen und Quelldaten ausgeben, um seine Vorteile nutzen zu können. Sie können einfach mit Ihren eigenen Daten beginnen und Open-Source-Anwendungen oder Programmiersprachen verwenden, um wertvolle Erkenntnisse zu gewinnen. Sogar ...
Grundlagen von K-Means und DBSCAN Clustering-Modelle für Predictive Analytics - Dummies
Unbeaufsichtigtes Lernen hat viele Herausforderungen für Vorhersageanalysen - einschließlich nicht zu wissen, was zu erwarten ist, wenn Sie einen Algorithmus ausführen. Jeder Algorithmus wird zu unterschiedlichen Ergebnissen führen. Sie werden nie sicher sein, ob ein Ergebnis besser ist als das andere - oder ob das Ergebnis einen Wert hat. Wenn Sie wissen, was die Ergebnisse sollen ...
Alternative Big Data Solutions - Dummies
Wenn Sie Hadoop überfliegen, sehen Sie alternative Big Data-Lösungen am Horizont. Diese Lösungen ermöglichen es, mit Big Data in Echtzeit zu arbeiten oder alternative Datenbanktechnologien zu verwenden und zu verarbeiten. Hier lernen Sie die Echtzeit-Verarbeitungsframeworks kennen, dann die Massively Parallel Processing (MPP) -Plattformen und schließlich das NoSQL ...
Grundlagen statischer und gestreamter Daten in Predictive Analyics - Dummys
Daten in Predictive Analytics können identifiziert werden als gestreamt, statisch oder eine Mischung aus beiden. Gestreamte Daten ändern sich kontinuierlich; Beispiele dafür sind der ständige Strom von Facebook-Updates, Tweets auf Twitter und die sich ständig ändernden Aktienkurse, während der Markt noch offen ist. Streamed-Daten ändern sich ständig; statische Daten sind in sich abgeschlossen und eingeschlossen. Die ...
Grundlagen von Datentypen und Strukturen in R Programmierung für Predictive Analytics - Dummies
In R Bei der Programmierung für Vorhersageanalysen werden Datentypen manchmal mit Datenstrukturen verwechselt. Jede Variable im Programmspeicher hat einen Datentyp. Sicher, Sie können mit mehreren Variablen in Ihrem Programm davonkommen und dennoch überschaubar sein. Aber das funktioniert wahrscheinlich nicht so gut, wenn Sie Hunderte (oder Tausende) von Variablen haben; ...
10 Möglichkeiten, Ihre maschinellen Lernmodelle zu verbessern - Dummies
Jetzt, da Sie den Algorithmus zum maschinellen Lernen abgeschlossen haben Wenn Sie von den mit Python oder R gewonnenen Daten lernen, denken Sie über die Ergebnisse Ihres Testsets nach und fragen sich, ob Sie diese verbessern oder das bestmögliche Ergebnis erzielen können. Es gibt eine Reihe von Überprüfungen und Aktionen, die auf Methoden hinweisen, die Sie verwenden können ...
Besserung der Welt durch Data Science - Dummies
Da die Datenwissenschaft komplexe Methoden, Ansätze und Erkenntnisse beinhaltet, können Sie das Ziel für jedes Projekt leicht aus den Augen zu verlieren - so genau auf die Rinde der Bäume zu schauen, dass Sie vergessen, Ihren Weg aus dem Wald zu finden, mit anderen Worten. Viele Datenwissenschaftler haben viel Zeit verschwendet ...
Grundlagen der R-Programmierung für Predictive Analytics - Dummies
R ist eine Programmiersprache, die ursprünglich für Statistiker geschrieben wurde Analyse, einschließlich vorausschauender Analytik. Es handelt sich um eine Open-Source-Software, die in der akademischen Welt verbreitet wird, um solche Disziplinen wie Statistik, Bioinformatik und Wirtschaftswissenschaften zu unterrichten. Seit seinen bescheidenen Anfängen wurde es inzwischen auf Datenmodellierung, Data Mining und prädiktive Analyse erweitert. R hat eine sehr aktive ...
Grundlagen von inhaltsbasierten Predictive Analytics-Filtern - Dummies
Inhaltsbasierte Predictive Analytics-Empfehlungssysteme entsprechen meist Funktionen (markierte Schlüsselwörter) unter ähnlichen Elementen und dem Benutzerprofil, um Empfehlungen abzugeben. Wenn ein Benutzer ein Element kauft, das Merkmale gekennzeichnet hat, werden Elemente mit Funktionen empfohlen, die mit denen des ursprünglichen Elements übereinstimmen. Je mehr Features übereinstimmen, desto höher ist die Wahrscheinlichkeit, dass der Benutzer es mag ...
Grundlagen von Predictive Analytics Datenklassifikationsprozess - Dummys
Auf Messingtaste, prädiktive Analysedaten Die Klassifizierung besteht aus zwei Phasen: der Lernphase und der Voraussagephase. Die Lernstufe beinhaltet das Trainieren des Klassifizierungsmodells durch Ausführen eines bestimmten Satzes von Vergangenheitsdaten durch den Klassifizierer. Das Ziel ist es, Ihrem Modell beizubringen, versteckte Beziehungen und Regeln zu extrahieren und zu entdecken - die ...
Grundlagen von Data Clusters in der Predictive Analysis - Dummies
Ein Datensatz (oder Datensammlung) ist eine Menge von Elementen in der vorausschauenden Analyse. Zum Beispiel ist ein Satz von Dokumenten ein Datensatz, in dem die Datenelemente Dokumente sind. Eine Reihe von Informationen zu sozialen Netzwerkbenutzern (Name, Alter, Freunde, Fotos usw.) ist ein Datensatz, in dem die Datenelemente Profile sozialer ...
Big Data und Electric Utilities - Dummies
Ein Bereich, in dem Big Data Auswirkungen auf Stromversorgungsunternehmen hat, ist die Entwicklung von intelligente Zähler. Intelligente Messgeräte bieten eine genauere Messung des Energieverbrauchs, indem sie weitaus häufigere Messwerte als herkömmliche Messgeräte liefern. Ein Smart Meter kann mehrere Messwerte pro Tag geben, nicht nur einmal im Monat oder einmal pro Quartal. ...
Big Data Analytics Lösungen Anbieter - Dummies
Eine Reihe von Anbietern auf dem Markt unterstützen heute den wachsenden Bedarf an Big Data Lösungen für dein Geschäft. Hier finden Sie eine Auflistung einiger Lösungen, die Sie vielleicht interessieren: IBM verfolgt einen unternehmensweiten Ansatz für Big Data und die Integration auf der gesamten Plattform, einschließlich der Einbettung / Bündelung seiner Analysen. Die Produkte umfassen ein Lagerhaus ...
Grundlagen strukturierter und unstrukturierter Daten in Predictive Analysis - Dummies
Daten in Datenbanken, Dokumenten, - Mails und andere Datendateien für die vorausschauende Analyse können entweder als strukturierte oder unstrukturierte Daten kategorisiert werden. Strukturierte Daten sind gut organisiert, folgen einer konsistenten Reihenfolge, sind relativ leicht zu durchsuchen und abzufragen und können leicht von einer Person oder einem Computerprogramm abgerufen und verstanden werden. Ein klassisches Beispiel ...
Grundlagen der Uplift Predictive Analytics Modelle - Dummies
Woher wissen Sie, dass der Kunde, den Sie mit Predictive Analytics hast du sowieso nicht gekauft? Um diese Frage zu klären, können Sie es auf verschiedene Arten wiedergeben: Woher wissen Sie, dass der Kunde nicht gekauft hätte, selbst wenn er den Marketingkontakt nicht von Ihnen erhalten hätte? Woher wissen Sie, was ...
Grundlagen wichtiger technologischer Trends in Predictive Analytics - Dummys
Traditionelle prädiktive Analysetechniken können nur Einblicke in die Basis von historischen Daten. Ihre Daten - sowohl vergangene als auch eingehende - können Ihnen einen verlässlichen Prädiktor liefern, mit dem Sie bessere Entscheidungen treffen können, um Ihre Geschäftsziele zu erreichen. Das Tool zum Erreichen dieses Ziels ist die vorausschauende Analyse. Wie man die Vorhersageanalytik erforscht ...
Big Data und Healthcare Services - Dummies
Gesundheitswesen ist ein Bereich, in dem Big Data das Potenzial hat, dramatische Lebensqualität. Die zunehmende Verfügbarkeit riesiger Datenmengen und die schnell steigende Rechenleistung könnten Forschern Durchbrüche ermöglichen, wie z. B .: Vorhersage von Krankheitsausbrüchen Ein besseres Verständnis für die Wirksamkeit und die ...
Big Data und Hochschulbildung - Dummies
Big Data macht dramatische Veränderungen im Bildungsbereich. Ein Bereich, der sich als besonders vielversprechend erwiesen hat, sind computergestützte Lernprogramme, die Pädagogen sofort Feedback geben. Die aus diesen Programmen gesammelten Daten können wichtige Informationen liefern, um die wichtigsten Herausforderungen zu identifizieren: Schüler, die zusätzliche Hilfe benötigen Schüler, die bereit für fortgeschritteneres Material sind ...
Vorteile und Visualisierungskomplexitäten als Werkzeug in der Predictive Analysis - Dummies
Napoleon Bonaparte sagte: "Eine gute Skizze ist besser als eine lange Rede. "In der Vorhersageanalyse präsentiert die Datenvisualisierung analytische Ergebnisse als ein Bild, das leicht verwendet werden kann, um realistische, umsetzbare Erzählungen möglicher Zukünfte zu erstellen. Das liegt daran, dass das menschliche Gehirn Bilder leichter zu verdauen findet als Text oder Zahlen. Narrative auf der Grundlage von Analysen ...
Big Data und Finance - Dummies
Ein Bereich der Finanzbranche, der stark von Big Data betroffen ist, sind die Handelsaktivitäten von Banken und anderen Finanzinstituten. Ein Beispiel ist der Hochfrequenzhandel (High-Frequency Trading, HFT), eine relativ neue Handelsform, die von der Fähigkeit abhängt, in extrem kurzen Zeitabständen große Mengen an Trades auszuführen. HFT-Händler machen ...