Video: Elastic Meetup with Prelert and Nuxeo - March 3rd, Silicon Valley 2024
Enterprise Content Management (ECM) -Systeme gibt es bereits seit mehr als zehn Jahren. Dokument NoSQL kann Wettbewerb anbieten. Beispiele für ECMs sind IBM FileNet, DB2 Content Manager und EMC Documentum. Viele kleinere Unternehmen wie Stellent (jetzt Oracle) wurden in größere Angebote integriert.
Ein vereinfachtes ECM-System namens "Basic Content Services" erschien ebenfalls - am häufigsten in Microsoft SharePoint. Das Aufkommen von SharePoint machte den ECM-Markt zum Standard und trocknete Innovationen aus, wenn auch zum Vorteil geringerer Lizenzkosten für Kunden.
ECM-Systeme unterstützen die Dokumentversionierung - in der Regel eine größere veröffentlichte Version und eine kleinere in Bearbeitung befindliche Version, obwohl einige auch eine dritte "Überarbeitungsnummer" unterstützen. Diese Systeme unterstützten das Speichern eines Dokuments getrennt von seinen Metadaten und erzwingen den Zugriff auf diese Dokumente und Eigenschaften für den Lese- und Schreibzugriff.
Die Workflow-Unterstützung wurde auch in die meisten bekannten ECM-Systeme integriert. Diese reichten vom grundlegenden Workflow - Genehmigung und Aktualisierung von Dokumenten - bis hin zum vollständigen End-to-End-Geschäftsprozessmanagement einschließlich Prozesssimulation und Round-Trip-Reengineering zur kontinuierlichen Prozessverbesserung.
Records Management Systeme (RMS) wurden häufig auf ECM-Systemen aufgebaut, wodurch die Anwendung von Aufbewahrungsregeln auf Dokumente ermöglicht und diese vor Änderungen geschützt werden. Dies ist zum Beispiel besonders nützlich, wenn Sie sich in einer regulierten Branche befinden und wichtige Dokumente während eines Gerichtsverfahrens oder bei der Aufdeckung aufbewahren müssen.
Diese ECM-Systeme speichern die Dokumente normalerweise in einem Dateisystem und die Metadaten in einem relationalen Datenbankverwaltungssystem. Die ECM-Systeme waren effektiv Middleware-Anwendungen, die für eine hohe Verfügbarkeit geclustert werden konnten, die sich jedoch auf eine zentralisierte Datenbank und Dateifreigaben stützten. Sie hatten eine begrenzte Skalierbarkeit für sehr hohe Geschwindigkeitsaufnahmen und waren besser ausgerichtet auf weniger und größere wichtige Dokumente, wie z. B. Office-Dateien und hochwertige TIFF-Bilder aus dem Dokumentenscannen.
Dokument-NoSQL-Datenbanken fügen ständig neue Funktionen hinzu. Ihre hohe Skalierbarkeit und ihre Fähigkeit, auf sehr billigen Commodity-Servern zu laufen, bedeuten, dass sie noch weniger kosten als Standard-ECM-Systeme.
Einige NoSQL-Datenbanken unterstützen das Speichern mehrerer Versionen. Die meisten dieser Datenbanken sind derzeit Bigtable-Klone, aber einige Dokumentdatenbanken unterstützen dies. MarkLogic Server verfügt über ein DLS-Add-on (Document Library Services), das die versionierte Speicherung von Dokumenten unterstützt, obwohl dies in der REST-API von MarkLogic nicht sichtbar ist.
MarkLogic Server enthält auch ein Content Processing Framework (CPF). CPF ist eine Zustandsmaschine, die ein einzelnes Dokument über einen Lebenszyklus hinweg bewegt und auf dem Inhalt basierende Aktionen ausführt, um normalerweise binäre Dokumente in XHTML zu konvertieren und die Entitätsextraktion mithilfe von Tools von Drittanbietern durchzuführen.
Diese kleinen Feature-Sets können in Zukunft von mehreren NoSQL-Anbietern übernommen und erweitert werden, um dieselben Engine-Level-Features bereitzustellen, die Microsoft SharePoint- und ECM-Systeme bieten. Wenn dies der Fall ist, können NoSQL-Dokumentendokumentationen zu den neuen Speicher- und Metadaten-Engines hinter ECM werden, was einen erhöhten Durchsatz und geringere Kosten für Kunden bedeutet. Es verspricht auch eine eingebettete Suche aus diesen Datenbanken im ECM-System selbst. Dies wird im Vergleich zu ECM-Systemen allein eine verbesserte Funktionalität bieten.