Video: Data Mining Lecture - - Advance Topic | Web mining | Text mining (Eng-Hindi) 2025
Jeder Bereich der Technologie ändert sich ständig, und Data Warehousing ist keine Ausnahme. Data Warehousing steht am Rande einer neuen Generation von Technologien. Sie müssen sich mit einigen der wichtigsten Trends vertraut machen.
Data Warehouses umfassen in der Regel nur wenige verschiedene Datentypen: Zahlen, Daten und zeichenbasierte Informationen (wie Namen, Adressen, Produktbeschreibungen und Codes) Die nächste Welle von Data Warehousing, in der unstrukturierte Daten mit multimedialen Inhalten (Bilder, Bilder, Video, Audio und Dokumente) reifen, wird als Teil eines Data Warehouse hier detailliert beschrieben
Starten Sie Ihren Webbrowser und verbringen Sie ein paar Stunden damit, im Internet herumzustöbern und alle möglichen coolen Seiten auszuprobieren. Sie können Bilder, Video- und Audioclips finden, Eingabeformulare zum Ausfüllen von Informationen, die an die Datenbank einer Site gesendet werden sollen Se, tabellarische Ergebnisse basierend auf Anfragen, die Sie machen könnten - fast alles.
Heutzutage speichert eine Organisation einen großen Teil ihrer Daten normalerweise in Dokumenten, die mit Produktivitätswerkzeugen wie Microsoft Excel und Word erstellt wurden. Darüber hinaus hat die Digitalisierung in den Bereichen Fotografie, Dokumentenscannen, Videoproduktion und Audioformate die Palette der unstrukturierten Datenformate erweitert, die Sie für Geschäftsdaten verwenden können.
Die Linien zwischen strukturierten Daten (traditionelle Datentypen, die Computeranwendungen seit Jahren verwenden) und unstrukturierten Daten (wie Multimedia-Dokumente) sind verschwommen. Vor nicht allzu langer Zeit, wenn Sie eine Multimedia-Umgebung erstellen wollten, die sowohl strukturierte als auch unstrukturierte Daten enthält, haben Sie diese Schritte nur locker befolgt:
-
Erstellen Sie eine relationale Datenbank für Ihre strukturierten Daten.
-
Verwenden Sie ein Dokumentenverwaltungssystem oder ein Image-Management-System für Ihre unstrukturierten Daten.
-
Um logische Links in Umgebungen zu behandeln, legen Sie in jeder relationalen Datenbankzeile eine oder mehrere Spalten ab, die auf verwandte Dokumente oder Bilder verweisen.
Diese Umgebungen waren relativ umständlich und anfällig für Probleme. Zum Beispiel haben sich Software-Upgrades auf ein System negativ auf das andere System ausgewirkt (z. B. Verbindungsabbrüche).
Die Entstehung einer neuen Generation von Geschäftsanwendungen, die traditionelle relationale Datenstrukturen mit unstrukturierten digitalen Inhalten verbindet, hat bereits begonnen. Diese Fülle digitaler Inhalte bedeutet, dass Unternehmen nun versuchen, sowohl relationale (strukturierte) Daten als auch unstrukturierte Daten auf Unternehmensebene zu verwalten.
Betrachten Sie beispielsweise eine Anwendung für medizinische Aufzeichnungen. Vor fünfzehn Jahren hätte die Anwendung höchstwahrscheinlich eine Liste von medizinischen Aufzeichnungen geführt, die als einfache Zeilen und Spalten gespeichert waren.
Heutzutage und in naher Zukunft wird eine Anwendung für medizinische Aufzeichnungen eher eine Reihe von Besuchsdatensätzen verwalten, die Referenzbilder, Röntgenbilder, CAT-Scans, Verschreibungen und andere Referenzdokumente enthalten - und diese Aufzeichnungen können auch enthalten. übergeordnete Funktionen wie räumliche Visualisierung, Berichterstellung und Analyse.
Viele Unternehmen sind (oder sind derzeit) bestrebt, diese unstrukturierten Daten in nützliche Informationen umzuwandeln, aber sie werden feststellen (oder feststellen, dass ihre aktuelle Data Warehousing- und Business Intelligence-Technologie keine gründliche Analyse dieser Daten liefern kann)… Traditionelle Data-Warehousing- und Business-Intelligence-Technologien und -Infrastrukturen haben technologische Zwänge, die ihre Fähigkeit zur Adressierung dieser Daten einschränken.
