Inhaltsverzeichnis:
- Entitätsextraktion und -anreicherung
- Suche und Benachrichtigung
- Aggregatfunktionen
- Charting und Business Intelligence
Video: data2day 2016 – Daniel Wrigley: SQL meets NoSQL – Interaktive IoT Datenanalyse trifft Open Source... 2024
Das Speichern und Abrufen großer Datenmengen ist schnell erledigt, und sobald Sie Ihre neu verwalteten Daten in NoSQL gespeichert haben, können Sie großartige Dinge tun.
Entitätsextraktion und -anreicherung
Sie können Datenbankauslöser, Warnungsmaßnahmen und externe Systeme verwenden, um Quelldaten zu analysieren. Vielleicht ist es meistens Freitext, aber erwähnt bekannte Themen. Diese Auslöser und Warnungsmaßnahmen können den Text als eine Person oder Organisation hervorheben, indem sie den Inhalt selbst und das Dokument, das er enthält, effektiv markieren.
Ein gutes Beispiel ist der Inhalt eines Nachrichtenartikels. Sie können ein Tool wie Apache Stanbol oder OpenCalais verwenden, um Schlüsselbegriffe zu identifizieren. Diese Werkzeuge könnten "Präsident Putin" sehen und entscheiden, dass dies eine Person namens Wladimir Putin betrifft, der Russe ist und der derzeitige Präsident der Russischen Föderation ist.
Weitere Beispiele sind Krankheits- und Medikationsnamen, Organisationen, Gesprächsthemen, erwähnte Produkte und ob ein Kommentar positiv oder negativ war.
Dies sind alles Beispiele für Entitätsextraktion (das ist der Prozess des automatischen Extrahierens von Objekttypen aus ihren Textnamen) . Durch die Identifizierung von Schlüsselbegriffen können Sie sie kennzeichnen oder in ein XML-Element einbinden, das Ihnen dabei hilft, Inhalte effektiver zu durchsuchen.
Entitätsanreicherung bedeutet, Informationen zusätzlich zum Identifizieren basierend auf dem Originaltext hinzuzufügen. In Putins Beispiel können Sie das Klartextwort "Putin" in Präsident Putin verwandeln. Alternativ können Sie "London" nach London umdrehen.
Sie können diese Daten in einer Benutzeroberfläche als markierten Text mit einem Link zu weiteren Informationen zu jedem Thema anzeigen.
Sie können die Bereicherung durch Freitextsuche, Warnmeldungen, Datenbankauslöser und Integrationen in externe Software wie TEMIS Luxid und SmartLogic bereitstellen.
Suche und Benachrichtigung
Sobald Sie Ihre Informationen gespeichert haben, können Sie sie durchsuchen. Die Freitextsuche ist unkompliziert, aber nach der Entitätsextraktion haben Sie mehr Möglichkeiten. Sie können gezielt nach einer Person mit dem Namen "Orange" suchen (wie bei William of Orange), anstatt nach Datensätzen zu suchen, die den Begriff Orange erwähnen - was natürlich auch eine Farbe und eine Frucht ist.
Dies führt zu einer detaillierteren Suche. Es ermöglicht auch eine facettierte Navigation. Wenn Sie zu Amazon gehen und nach Harry Potter suchen, sehen Sie Kategorien für Bücher, Filme, Spiele und so weiter. Die Produktkategorie ist ein Beispiel für eine Facette , die einen Aspekt von Daten in den Suchergebnissen anzeigt - also die häufigsten Werte jeder Facette in allen Suchergebnissen, sogar die nicht auf der aktuellen Seite.
Benutzeroberflächen können umfangreiche Explorationen in Daten unterstützen (sowie grundlegende Google-Suchvorgänge). Benutzer können sie auch verwenden, um frühere Suchen zu speichern und zu laden.
Sie können gespeicherte Suchkriterien einrichten, sodass Alerts aktiviert werden, wenn neu hinzugefügte Datensätze mit diesen Kriterien übereinstimmen. Wenn also ein neuer Datensatz ankommt, der Ihren Suchkriterien entspricht, wird eine Aktion ausgeführt. Vielleicht wird "Putin" zu Putin
Nicht alle Suchmaschinen sind in der Lage, jeden Suchbegriff zu einem Alarm zu machen. Einige sind auf Textfelder beschränkt; Andere können keine Geodatenkriterien erfüllen. Stellen Sie sicher, dass Sie die Warnungen verarbeiten können, die Sie konfigurieren müssen.
Aggregatfunktionen
Sobald Sie relevante Informationen gefunden haben, möchten Sie vielleicht tiefer graben. Je nach Quelle, könnte man fragen, wie viele Länder haben ein BIP von mehr als $ 400 Milliarden, oder was ist das Durchschnittsalter aller Mitglieder in Ihrem Stammbaum, oder wo tun die meisten Schlangenbisse kommen in Australien. Diese Beispiele veranschaulichen, wie Analysen über eine Reihe von Suchergebnissen durchgeführt werden. Dies sind Zählung, Mittelwert und Geodatenberechnung.
Die Möglichkeit, solche Berechnungen neben den Daten durchzuführen, bietet mehrere Vorteile. Der erste Vorteil ist, dass Sie die Indizes verwenden können, um die Dinge zu beschleunigen. Zweitens werden diese Indizes wahrscheinlich im Speicher zwischengespeichert, wodurch sie noch schneller werden. Drittens sind in Speicher Indizes besonders nützlich für eine NoSQL Datenbank Hadoop File System (HDFS) Speicher mit. HDFS macht keine nativen Indizierung oder In-Memory-Spalte speichert für eine schnelle Aggregation Berechnungen selbst - es erfordert eine NoSQL-Datenbank auf, dies zu tun.
Die Facettierte Navigation ist ein Beispiel für zahlbasierte Aggregationen über Suchergebnissen, die in einer Benutzeroberfläche angezeigt werden. Das Gleiche gilt für eine Zeitleiste, die die Anzahl der Datensätze angibt, die einen bestimmten Zeitpunkt angeben. Möchten Sie beispielsweise Ergebnisse von diesem Jahr, diesem Monat oder dieser Stunde anzeigen?
Wenn Sie diese Funktionalität wünschen, stellen Sie sicher, dass Ihre Datenbank Aggregate effizient neben den Daten berechnen kann. Die meisten NoSQL-Datenbanken tun dies, aber einige nicht.
Charting und Business Intelligence
Die nächste offensichtlichen User-Interface-Erweiterung beinhaltet Charting und Anzeigen von Tabellenübersicht für die Live-Management-Informationen und historische Business-Intelligence-Analyse.
Die meisten NoSQL-Datenbanken bieten eine einfach zu integrierende REST-API in ihren -databases. Dies bedeutet, dass Sie eine Reihe von Anwendungsebenen anschließen oder sogar direkt JavaScript-Anwendungen mit diesen Datenbanken verbinden können. Eine Vielzahl ausgezeichneter Charting-Bibliotheken steht für JavaScript zur Verfügung. Sie können sogar das R Ecosystem verwenden, um Diagramme basierend auf Daten in diesen Datenbanken zu erstellen, nachdem Sie einen geeigneten Datenbank-Connector installiert haben.
Einige NoSQL-Datenbanken bieten sogar ein relationales ODBC- oder JDBC-Datenbank-Plug-In. Erstellen von Indizes innerhalb eines gegebenen Datensatz und als -relational Ansicht, die eine nette Art und Weise unstrukturierte Daten in einer NoSQL Dokumentendatenbank in Daten zu verwandeln, die mit einem Business-Intelligence-Tool analysiert werden können.
Überprüfen Sie, ob Ihr NoSQL-Datenbankanbieter Visualisierungstools zur Verfügung stellt oder ob Geschäftspartnern Tools zur Verfügung stehen, die mit diesen Datenbanken verbunden werden können. Zu den Trendtools gehören Tableau Server, ein moderner gemeinsam genutzter Business-Intelligence-Server, der die Veröffentlichung interaktiver Berichte über Daten in einer Vielzahl von Datenbanken, einschließlich NoSQL-Datenbanken, unterstützt.