Video: Data Warehouse einfach erklärt 2024
Daten, die von großen Unternehmen im Tagesgeschäft gesammelt werden, werden normalerweise in Datenbanken gespeichert. Datenbankadministratoren sind jedoch möglicherweise nicht bereit, Data Minern direkten Zugriff auf diese zu gewähren. Datenquellen und direkter Zugriff stellen möglicherweise aus Ihrer Sicht ebenfalls nicht die beste Option dar. Direkter Zugriff auf betriebliche (für routinemäßige Geschäftsabläufe verwendete) Datenbanken kann eine schlechte Idee sein, da
-
Data Miner sehr viele Daten verwenden. > Sie könnten unbeabsichtigt Ressourcen binden und in gewöhnliche Geschäftsabläufe eingreifen.
-
Sie könnten unbeabsichtigt gegen ein Datenschutzgesetz oder ein anderes Datenmanagement verstoßen. Anforderung, wenn Ihr Datenzugriff nicht ordnungsgemäß gesteuert wird. Operationale Datenbanken sind nicht für Data Mining organisiert.
-
Sie könnten viel Zeit damit verbringen, die benötigten Daten zu erhalten, und trotzdem nicht sicher sein, dass sie richtig sind. Wenn Sie Daten von benötigen eine operative Datenbank (und Sie haben die entsprechende Genehmigung zur Verwendung der Daten), sollten Sie Ihre Bedürfnisse mit dem Administrator besprechen, der für diese Daten verantwortlich ist. Sie müssen genau erklären, welche Daten Sie benötigen, welches Format Sie für Data Mining benötigen und ob Sie die Daten nur einmal oder kontinuierlich benötigen.
Der laufende Datenzugriff ist eine andere Angelegenheit. Der Administrator möchte möglicherweise nicht immer wieder Datenextrakte bereitstellen, und der direkte Zugriff auf Geschäftssysteme ist riskant. Eine allgemeine Lösung besteht darin, eine analytische Datenbank
zu erstellen. Dies ist eine gewöhnliche relationale Datenbank, die von herkömmlichen Geschäftssystemen getrennt ist. Daten werden routinemäßig (und automatisch) von den Geschäftssystemen in die Analysedatenbank übertragen, und Data Miner können jederzeit darauf zugreifen.
Wenn der Datenbankadministrator darauf besteht, dass die Daten nicht auf diese Weise gespeichert werden können, fragen Sie, ob es möglich ist, eine
Ansicht zu erstellen (eine gespeicherte Abfrage, die wie eine herkömmliche Datentabelle abgefragt werden kann). mit der Organisation, die Sie brauchen. Viele Data-Mining-Produkte können Daten aus Datenbanken lesen. Die erforderlichen Schritte variieren auf der Grundlage des
-Designs der Data-Mining-Anwendung
-
Struktur der Quellendatenbank
-
Middleware, üblicherweise als
-
-Treiber bezeichnet ( ODBC-Treiber, JDBC-Treiber <), spezielle Software, die zwischen der Datenbank und der Anwendungssoftware vermittelt Dokumentation für Ihre Data-Mining-Anwendung sollte Ihnen mitteilen, ob sie Daten aus einer Datenbank lesen kann und wenn ja, welches Tool oder welche Funktion wie verwendet werden soll.Der Administrator, der die Analysedatenbank einrichtet, kann Details zum Zugriff auf die Datenbank bereitstellen. Wenn Sie bereits mit Datenbanken und anderen Anwendungen arbeiten, werden Sie nichts Überraschendes finden, wenn Sie dieselben Dinge mit einer Data-Mining-Anwendung tun. Wenn Datenbanken für Sie neu sind, erhalten Sie eine sachkundige Person aus Ihrer Organisation, die Sie durch den Prozess mit Ihrer eigenen Datenbank und Data Mining-Anwendung führt.