Phase 5 des CRISP-DM-Prozessmodells: Evaluation - Dummies
In den ersten vier Phasen des Prozessmodells des Cross-Industry Standard Process für Data Mining (CRISP-DM), Sie haben Daten erforscht und Muster gefunden, und nun müssen Sie fragen: Sind die Ergebnisse gut? Sie bewerten nicht nur die von Ihnen erstellten Modelle, sondern auch den Prozess, mit dem Sie sie erstellt haben, und ihr Potenzial ...
NoSQL Begriffe und Definitionen - Dummies
NoSQL kann etwas schwierig sein. Wenn Sie in der Schule Datenbanken studiert haben, wurden Sie vielleicht in einer relationalen Denkweise indoktriniert. Sagen Sie den meisten Leuten eine Datenbank, und sie denken, relationales Datenbankverwaltungssystem. Das ist natürlich, weil das RDBMS in den letzten 30 Jahren so dominant war. Um ...
NoSQL Für Dummies Cheat Sheet - Dummies
Als NoSQL-Entwickler ist die Wahl der richtigen Produktkategorie und des richtigen Produkts die erster Schritt. Diese Handbücher vergleichen die wichtigsten Funktionen einiger der beliebtesten NoSQL-Datenbanken.
Praktiken zur Gewährleistung von Big Data Governance - Dummies
Mit den Governance-Herausforderungen von Big Data, ist es weise und absolut Notwendig, um Praktiken zu haben, um sicherzustellen, dass Sie Ihre Informationen schützen. Während der Grad, in dem Sie diese tun, abhängig von Ihrem Geschäft schwanken, stellen Sie sicher, dass Sie die notwendigen Vorsichtsmaßnahmen treffen. Auditieren Sie Ihren Big-Data-Prozess Am ...
Grundlagen der Building Information Modelling - Dummies
Setzen. Aber die Grundlagen richtig zu machen ist alles in der Vorbereitung. Mit BIM können Sie neue Prozesse und Workflows erstellen und gemeinsam an Ihren Projekten arbeiten. BIM ist während der gesamten Projektzeit von der Konzeptphase, über die Konstruktion und dann über die ...
Setzen Sie Ihre Big Data zusammen - Dummies
Woher wissen Sie, wie Sie all Ihre Daten zusammenfügen? Bei einem Big-Data-Projekt zeigt das, was Sie mit Ihren strukturierten und unstrukturierten Daten machen möchten, an, warum Sie sich für ein anderes als ein anderes entscheiden. Es bestimmt auch die Notwendigkeit, eingehende Datenstrukturen zu verstehen, um diese Daten in ...
Phase 6 des CRISP-DM-Prozessmodells: Deployment - Dummies
Der Bergbau zahlt sich aus. In dieser letzten Phase des CRISP-DM-Prozesses (Cross-Industry Standard Process for Data Mining) spielt es keine Rolle, wie brillant Ihre Entdeckungen sind oder wie perfekt Ihre Modelle zu den Daten passen, wenn Sie diese nicht tatsächlich verwenden. Dinge, um die Art und Weise zu verbessern, wie Sie Geschäfte machen. Die Bereitstellung ...
Phase 3 des CRISP-DM-Prozessmodells: Datenvorbereitung - Dummies
Data Miner verbringen die meiste Zeit mit der dritten Phase des CRISP-DM-Prozessmodells (Cross-Industry Standard Process for Data Mining): Datenaufbereitung. Die meisten Daten, die für das Data Mining verwendet werden, wurden ursprünglich für andere Zwecke gesammelt und aufbewahrt und müssen noch weiter verfeinert werden, bevor sie für die Modellierung verwendet werden können. Die Datenvorbereitungsphase umfasst ...
Phase 4 des CRISP-DM-Prozessmodells: Modellierung - Dummies
Modellierung ist das Teil des Cross-Industry Standard Process für Data Mining (CRISP-DM) Prozessmodell, das die meisten Data Miner am besten mögen. Ihre Daten sind bereits in gutem Zustand und jetzt können Sie nach nützlichen Mustern in Ihren Daten suchen. Die Modellierungsphase umfasst vier Aufgaben. Dies sind: Auswählen von Modellierungstechniken Entwerfen von Tests Modellierung (en) Bewerten ...
Phase 1 des CRISP-DM-Prozessmodells: Business Understanding - Dummies
Das Kreuz -Industry Standard Process für Data Mining (CRISP-DM) ist das dominierende Prozess-Framework für Data Mining. In der ersten Phase eines Data-Mining-Projekts definieren Sie, bevor Sie an Daten oder Tools herantreten, was Sie erreichen möchten, und definieren die Gründe für die Erreichung dieses Ziels. Die Business-Verständnis-Phase umfasst vier Aufgaben (primär ...
Setzen Sie die richtige Big Data-Organisationsstruktur an ihren Platz - Dummies
In der Regel beginnen Unternehmen ihre Reise zu großen Daten, indem Sie mit einem Organisationsexperiment beginnen, um zu sehen, ob Big Data eine wichtige Rolle bei der Definition und Beeinflussung der Geschäftsstrategie spielen kann. Nachdem jedoch klar wird, dass Big Data eine strategische Rolle als Teil der Informationsverwaltungsumgebung einnehmen wird, müssen Sie sicherstellen, dass ...
Phase 2 des CRISP-DM-Prozessmodells: Datenverstehen - Dummies
In der In der zweiten Phase des CRISP-DM-Prozessmodells (Cross-Industry Standard Process for Data Mining) erhalten Sie Daten und stellen sicher, dass sie für Ihre Anforderungen geeignet sind. Sie könnten Probleme identifizieren, die dazu führen, dass Sie zum Geschäftsverständnis zurückkehren und Ihren Plan überarbeiten. Vielleicht entdecken Sie sogar Schwachstellen in Ihrem Geschäftsverständnis, ein weiterer Grund, warum ...
Reduzierung der Zeit bis zum Wert in NoSQL - Dummies
Zeit bis zum Wert ist der Zeitaufwand für den Start eines IT-Projekts um geschäftlichen Nutzen zu erzielen. Dies kann zu spürbaren Vorteilen bei der Kostenreduzierung oder der Fähigkeit, neue Geschäfte zu tätigen, oder bei immateriellen Vorteilen wie der Bereitstellung eines besseren Kundenservices oder besserer Produkte führen. Key-Value-Stores sind die einfachsten NoSQL-Datenbanken in Bezug auf ...
Recherchieren für Ihre eigenen Daten - dummies
Jetzt, da Sie ein Data Miner sind, sind Sie auch ein Primärforscher. Klingt wissenschaftlicher, nicht wahr? Ihre Forschung ist primär, weil Sie mit rohen (unverarbeiteten) Daten beginnen und diese analysieren, um dem Wissen der Welt etwas Neues hinzuzufügen. Sie werden wahrscheinlich auch Sekundärforschung in Ihre Arbeit integrieren. Mit anderen Worten, Sie werden ...
Rollenbasierte Zugriffskontrolle in NoSQL - Dummys
Eine der häufigsten Methoden zur Sicherung von Daten in NoSQL ist um jedem Datensatz (oder Dokument oder Diagramm, abhängig von Ihrem Datenbanktyp) eine Reihe von Berechtigungen zuzuweisen, die mit Rollen verknüpft sind. Dies ist eine rollenbasierte Zugriffskontrolle oder kurz RBAC. Betrachten Sie eine Pressemitteilung für eine Website, die in einer ...
Skalierung NoSQL - Dummies
Ein gemeinsames Merkmal von NoSQL-Systemen ist ihre Skalierbarkeit über viele Commodity-Server hinweg. Diese relativ billigen Plattformen bedeuten, dass Sie Datenbanken erweitern können, indem Sie einen neuen Server hinzufügen, anstatt alte Hardware durch neue, leistungsstärkere Hardware in einer einzigen Aufnahme zu ersetzen. Es gibt Anwendungsfälle mit hohem Volumen, die Sie schnell zwingen werden ...
Tabellenkalkulationen, XML und Spezialdatenformate - Dummies
Sie müssen möglicherweise Daten verwenden, die in einer Tabelle enthalten sind , XML (Extensible Markup Language) oder eines von Dutzenden weniger gebräuchlicher Formate. Die Schlüsselfrage lautet immer: Importiert Ihre Data-Mining-Anwendung Daten in diesem Format? Solange Ihre Data-Mining-Anwendung über ein Tool zum Lesen des benötigten Datenformats verfügt, muss der Prozess ...
Die richtige Grundlage für Big Data setzen - Dummies
Also, wie fangen Sie mit Ihrer Reise zum Schaffen an? die richtige Umgebung, damit Sie bereit sind, mit Big Data zu experimentieren und bereit zu sein, Ihre Big-Data-Nutzung zu erweitern, wenn Sie bereit sind? Müssen Sie in neue Technologien für Ihr Rechenzentrum investieren? Können Sie die Cloud nutzen?
Sicherheitsbetrachtungen mit Big Data - Dummies
Während Unternehmen sehr besorgt über die Sicherheit und Governance ihrer Daten im Allgemeinen sind, Big-Data-Initiativen bringen gewisse Komplexitäten und unvorhergesehene Probleme mit sich, auf die viele Unternehmen nicht vorbereitet sind. Häufig werden Big Data-Analysen mit einer Vielzahl von Datenquellen durchgeführt, die aus vielen ungelesenen Quellen stammen könnten. Darüber hinaus sind Ihre ...
Simulation von abstrakten Maschinen mit Algorithmen - Dummies
Je mehr Operationen ein Algorithmus erfordert, desto komplexer ist er. Die Komplexität ist ein Maß für die Effizienz des Algorithmus hinsichtlich der Zeitverwendung, da jede Operation einige Zeit in Anspruch nimmt. Angesichts des gleichen Problems sind komplexe Algorithmen im Allgemeinen weniger vorteilhaft als einfache Algorithmen, da komplexe Algorithmen mehr Zeit benötigen. Denken Sie an die Zeiten, in denen die Geschwindigkeit von ...
Die Daten aussortieren, die Sie benötigen - Dummies
Wenn Sie Data Mining betreiben, haben Sie manchmal mehr Daten als Sie benötigen für ein bestimmtes Projekt. Hier erfahren Sie, wie Sie sich auf das beschränken können, was Sie brauchen. Eingrenzen der Felder Wenn Sie viele Variablen in einem Dataset haben, kann es schwierig sein, die zu finden, die Sie interessieren. Und wenn Ihre Datensätze ...
Warum das Sortieren von Daten für Algorithmen wichtig ist - dummies
Stellen Sie ein Element in einer Liste vor, ohne es zu sortieren zuerst. Jede Suche wird zu einer zeitaufwendigen sequentiellen Suche. Aber es kann ein Fall dafür gemacht werden, dass Daten für Algorithmen nicht sortiert werden. Schließlich sind die Daten auch dann noch zugänglich, wenn Sie sie nicht sortieren - und das Sortieren braucht Zeit. Natürlich ist das Problem mit ...
Speichern von Big Data mit HBase - Dummies
HBase ist eine verteilte, nicht relationale (Spalten-) Datenbank, die HDFS als Persistenz verwendet. Speicher für Big-Data-Projekte. Es ist nach Google BigTable modelliert und kann sehr große Tabellen (Milliarden von Spalten / Zeilen) hosten, weil es auf Hadoop-Clustern von Standardhardware liegt. HBase bietet einen zufälligen Echtzeit-Lese- / Schreibzugriff auf Big Data. HBase ...
Streaming-Algorithmen und Bloom-Filter - Dummies
Herzstück vieler Streaming-Algorithmen sind Bloom-Filter. Vor fast 50 Jahren von Burton H. Bloom zu einer Zeit gegründet, als die Informatik noch recht jung war, bestand die ursprüngliche Absicht des Entwicklers dieses Algorithmus darin, Raum (Speicher) und / oder Zeit (Komplexität) gegen das zu tauschen, was er als zulässige Fehler bezeichnete. Seine Originalarbeit trägt den Titel ...
Speichern von Daten in Bigtables - Dummies
Ein Bigtable hat Tabellen wie ein RDBMS, aber im Gegensatz zu einem RDBMS eine Bigtable-Tabelle haben normalerweise keine Beziehungen zu anderen Tabellen. Stattdessen werden komplexe Daten in einer einzigen Tabelle gruppiert. Eine Tabelle in einem Bigtable besteht aus Gruppen von Spalten, die als Spaltenfamilien bezeichnet werden, und einem Zeilenschlüssel. Diese zusammen ermöglichen ein schnelles Nachschlagen von ...
Streaming von Datenströmen - Dummies
Wenn Daten in großen Mengen fließen, kann es schwierig oder sogar unmöglich sein, alles zu speichern. In der Tat kann es gar nicht sinnvoll sein, alles zu speichern. Hier sind einige Zahlen von etwas von dem, was Sie erwarten können, innerhalb einer einzigen Minute im Internet zu geschehen: 150 Millionen E-Mails schickten 350.000 neue Tweets geschickt auf ...
Strukturierung von Daten zur Gewinnung einer Lösung - Dummies
Menschen denken über Daten auf unspezifische Weise nach und wenden verschiedene Regeln an Daten, um es so zu verstehen, wie es Computer niemals können. Die Datenansicht eines Computers ist strukturiert, einfach, kompromisslos und auf keinen Fall kreativ. Wenn Menschen Daten für einen Computer aufbereiten, interagieren die Daten oft mit den Algorithmen in ...
Nutzung von Flash-Speicher in NoSQL - Dummies
Wenn Sie unglaublich schnelle Schreibvorgänge benötigen, ist Flash-Speicher erforderlich (Im Gegensatz zum Aufruf von Flash Gordon). Das kostet natürlich RAM-Speicher. Das Schreiben in den Arbeitsspeicher wird Ihnen ungefähr die Größe Ihres Arbeitsspeichers bescheren. So haben Sie eine sehr schnelle Speicheroption direkt hinter Ihrem ...
Reden mit Data Mining mit Executives - Dummies
Sie werden nicht mit dem Data Mining anfangen, nur um Spaß am Spielen mit Zahlen zu haben. .. Sie wollen handeln. Sie möchten, dass die Dinge richtig gemacht werden und Sie verstehen, dass es wichtig ist, Geschäftsentscheidungen auf soliden Daten zu basieren. Aber Sie sind nicht derjenige mit der Macht, die Entscheidungen zu treffen. Sie müssen also ...
Die Ökonomie der Big Data - Dummies
Der beste Weg, die Wirtschaftlichkeit von Big Data zu verstehen, ist die Betrachtung der verschiedenen Methoden, um Big Data für Ihre Organisation nutzbar zu machen. Während die spezifischen Kosten aufgrund der Größe Ihrer Organisation, ihrer Kaufkraft, Lieferantenbeziehungen usw. variieren können, sind die Ausgabenklassen ziemlich einheitlich. Big Data ...
Die Big Data Governance-Herausforderung - Dummies
Data Governance ist für Ihr Unternehmen wichtig, unabhängig von Ihren Big Data-Quellen oder wie sie verwaltet werden. In der traditionellen Welt der Data Warehouses oder der relationalen Datenbankverwaltung ist es wahrscheinlich, dass Ihr Unternehmen gut verstandene Regeln darüber hat, wie Daten geschützt werden müssen. Zum Beispiel in der Gesundheitsbranche ist es ...
Das Bundesdatenportal: Daten. gov - dummies
Wenn Sie nach Daten suchen, die die Bundesregierung möglicherweise hat, aber Sie sich nicht sicher sind, welche Behörde beteiligt ist, starten Sie Ihre Suche im Bundesdatenportal. Dort finden Sie einen durchsuchbaren Katalog von Daten aller Bundesbehörden. Sie können nach Datensätzen nach Schlüsselwörtern suchen und Informationen darüber erhalten, was verfügbar ist, die Quelle ...
Die Grenzen von Umfragen für Data Mining - Dummies
Trotz der vielen wünschenswerten Aspekte der Umfrageforschung finden Sie auch Einschränkungen. Es ist schwierig, gute Daten zu erhalten, wenn es sich bei den Themen um Menschen handelt, egal, wie Sie vorgehen. Sogar Wissenschaftler, die sich bemühen, kontrollierte Studien durchzuführen, können die experimentellen Bedingungen bei Menschen nicht so kontrollieren wie bei Labortieren. Erreichen ...
Zehn Big Data Do's and Don'ts - Dummies
Viele Unternehmen, die mit der Erforschung von Big Data beginnen sind in den frühen Phasen der Ausführung. Betrachten Sie diese Do's und Don'ts als Teil Ihrer Strategie. Die meisten Unternehmen experimentieren mit Piloten, um herauszufinden, ob sie große Datenquellen für die Entscheidungsfindung nutzen können. Es ist leicht, Fehler zu machen, die dazu führen können, dass ...
Die Rolle traditioneller Betriebsdaten in der Big-Data-Umgebung - Dummies
Wissen welche Daten gespeichert und wo es gespeichert wird, sind kritische Bausteine in Ihrer Big-Data-Implementierung. Es ist unwahrscheinlich, dass Sie RDBMSs für den Kern der Implementierung verwenden, aber es ist sehr wahrscheinlich, dass Sie sich auf die in RDBMSs gespeicherten Daten verlassen müssen, um die höchste Wertschöpfung für die ...
Triple Store und Graph NoSQL Datenbank Features - Dummies
Sie können eine Triple-Store oder Graph NoSQL Datenbank verwenden, wenn Sie Sie haben ein Netz miteinander verbundener Daten, oder Sie können Ihre Daten einfach mit Tags versehen und Beziehungen gemäß den Datensätzen ableiten, die dieselben Tags verwenden. Diese Datenbankprodukte unterstützen diese wichtigen Funktionen. Feature-Bereich AllegroGraph MarkLogic Server Neo4j OrientDB ACID oder BASIS-ACID, ...
Big Data und das Internet der Dinge verstehen - Dummies
Wie verhält sich das Internet der Dinge zu Big Data? ? Das Internet der Dinge beschreibt die Tatsache, dass viele Alltagsgegenstände, von Windeln bis zu selbstfahrenden Autos, die Möglichkeit haben, Daten über das Internet zu senden und zu empfangen. Erfahren Sie mehr über das Internet der Dinge und die Explosion von ...
Zeit Voraussetzungen für Big Data - Dummies
Eine primäre Überlegung bei der Durchführung eines Big-Data-Projekts ist die projizierte Menge realer Zeit und Nicht-Echtzeit erforderlich, um Ihre Initiative durchzuführen. Bei Big Data geht es oft darum, Dinge zu tun, die nicht möglich waren, weil die Technologie nicht ausgereift genug war oder die Kosten unerschwinglich waren. Die große Veränderung bei Big Data ist die Fähigkeit ...
Die Leute, die in Data Mining involviert sind - Dummies
Als Data Miner, Ihr Platz im Organigramm kann eine spezielle Gruppe, die sich der Analytik widmet, oder innerhalb einer konventionellen Geschäftseinheit. Egal, wo Sie sich befinden, ob Sie sich mit Data Mining beschäftigen oder eine Vollzeitbeschäftigung machen, Sie werden am produktivsten sein, wenn Sie mit den Rollen vertraut sind ...
Triple und Graph Stores in NoSQL - Dummies
Obwohl es gerade jetzt prominent wird, hat das Konzept der Tripel gewesen seit 1998 dank dem World Wide Web Consortium (W3C) und Sir Tim Berners-Lee. Wenn Sie Erfahrung mit LinkedIn oder Facebook haben, kennen Sie wahrscheinlich den Begriff Social Graph. Unter der Haube dieser Ansätze ist ein einfaches Konzept: jede Tatsache (oder ...