Inhaltsverzeichnis:
Video: Data Mining using R | Data Mining Tutorial for Beginners | R Tutorial for Beginners | Edureka 2024
Hier finden Sie eine Übersicht über einige der Akteure im Big Data-Markt für Textanalysen. Manche sind klein, andere sind bekannte Namen. Einige nennen das, was sie tun Big-Data-Text-Analysen , , während einige einfach als Textanalysen bezeichnet werden.
Attensity für Big Data
Attensity ist eines der ursprünglichen Textanalyseunternehmen, das vor mehr als zehn Jahren begann, Produkte zu entwickeln und zu verkaufen. Zu diesem Zeitpunkt hat es über 150 Unternehmenskunden und eine der größten NLP-Entwicklungsgruppen der Welt. Attensity bietet mehrere Engines für Textanalysen an. Dazu gehören die automatische Klassifizierung, die Entitätsextraktion und die erschöpfende Extraktion. Exhaustive Extraction ist die Flaggschiff-Technologie von Attensity, die automatisch Informationen aus geparstem Text extrahiert und diese Informationen organisiert.
Das Unternehmen konzentriert sich auf soziale und Mehrkanalanalysen und -engagements, indem es Text für die Berichterstellung aus internen und externen Quellen analysiert und diese anschließend an Geschäftsbenutzer weiterleitet. Es hat kürzlich Biz360 gekauft, ein Social-Media-Unternehmen, das riesige Streams von sozialen Medien sammelt. Es hat ein Grid-Computing-System entwickelt, das leistungsstarke Funktionen für die Verarbeitung großer Mengen von Echtzeittext bietet.
Attensity verwendet ein Hadoop-Framework zum Speichern von Daten. Es verfügt außerdem über ein Datenwarteschlangensystem, das einen Orchestrierungsprozess erstellt, der Spitzen in eingehenden Daten erkennt und die Verarbeitung bei Bedarf auf mehr / weniger Servern anpasst.
Clarabridge für Big Data
Clarabridge, ein weiterer Anbieter von reinen Textanalysen, ist ein Spin-Off eines Business Intelligence (BI) Beratungsunternehmens (Claraview), das die Notwendigkeit von unstrukturierten Daten erkannt hat. Ziel ist es, Unternehmen dabei zu unterstützen, einen messbaren Geschäftswert zu erzielen, indem sie den Kunden ganzheitlich betrachten, wichtige Erfahrungen und Probleme aufzeigen und allen in einem Unternehmen helfen, in Echtzeit Maßnahmen zu ergreifen und zusammenzuarbeiten.
Dazu gehören die Echtzeit-Bestimmung der Stimmung und die Klassifizierung von Kundenfeedback-Daten / Text und die Bereitstellung des Verbatim für die zukünftige Verarbeitung in das Clarabridge-System.
Zu diesem Zeitpunkt bietet Clarabridge seinen Kunden einige ausgereifte und interessante Funktionen an, darunter eine Ursachenanalyse mit einem einzigen Klick, um festzustellen, was eine Änderung des Umfangs von Textfeeds, Stimmung oder Zufriedenheit im Zusammenhang mit neuen Problemen verursacht. Es bietet seine Lösung auch als Software as a Service (SaaS) an.
IBM für Big Data
Der Software-Riese IBM bietet unter dem Dach von Smarter Planet mehrere Lösungen im Bereich Text Analytics an.Neben IBM Watson und IBM SPSS bietet IBM auch IBM Content Analytics mit Enterprise Search an. IBM Content Analytics wurde basierend auf der Arbeit von IBM Research entwickelt.
IBM Content Analytics wird verwendet, um Inhalte in analysierte Informationen zu transformieren. Diese Informationen stehen für detaillierte Analysen zur Verfügung, ähnlich wie strukturierte Daten in einem BI-Toolset analysiert werden. IBM Content Analytics und Enterprise Search waren einst zwei separate Produkte.
Die konvergente Lösung zielt sowohl auf die erweiterte Unternehmenssuche ab, die Textanalysen verwendet, als auch auf eigenständige Inhaltsanalyse-Anforderungen. ICAES ist eng in die IBM InfoSphere BigInsights-Plattform integriert und ermöglicht sehr umfangreiche Such- und Inhaltsanalyse-Sammlungen.
OpenText für Big Data
OpenText, ein in Kanada ansässiges Unternehmen, ist wahrscheinlich am besten für seine Führungsposition bei Enterprise Information Management-Lösungen bekannt. Ihre Vision dreht sich um die Verwaltung, Sicherung und Gewinnung von Werten aus den unstrukturierten Daten von Unternehmen. Es bietet was es bedeutet "semantische Middleware. "
Die Evolution der semantischen Technologie basiert laut Unternehmen auf der Fähigkeit, Echtzeitanalysen mit hoher Genauigkeit für große Datensätze über Sprachen, Formate und Industriedomänen hinweg zu ermöglichen. "Die Idee hinter semantischer Middleware ist, dass Semantik auf verschiedenen Ebenen verfügbar gemacht werden kann und mit verschiedenen Technologien arbeiten kann, um geschäftliche Probleme anzugehen.
Mit anderen Worten kann die Textanalyse aktiviert und bei Bedarf genutzt werden.
SAS für Big Data
SAS löst seit langem komplexe Big-Data-Probleme. Vor einigen Jahren erwarb das Unternehmen den Textanalyse-Anbieter Teragram, um seine Strategie zu verbessern, sowohl strukturierte als auch unstrukturierte Daten in der Analyse zu verwenden und diese Daten für die deskriptive und vorausschauende Modellierung zu integrieren. Die Textanalysemöglichkeiten sind nun Teil der gesamten Analyseplattform, und Textdaten werden lediglich als weitere Datenquelle angesehen.
SAS setzt seine Innovationen im Bereich der Hochleistungs-Analytik fort, um sicherzustellen, dass die Leistung die Erwartungen der Kunden erfüllt. Das Ziel besteht darin, Probleme zu lösen, die früher Wochen dauerten, um sie zu lösen und sie in Tagen zu lösen, oder Probleme, die früher Tage in Anspruch nahmen, um sie zu lösen und sie innerhalb von Minuten zu lösen.
Der SAS High Performance Analytics-Server ist beispielsweise eine In-Memory-Lösung, mit der Sie analytische Modelle unter Verwendung vollständiger Daten und nicht nur einer Teilmenge der aggregierten Daten entwickeln können. SAS sagt, dass Sie Tausende von Variablen und Millionen von Dokumenten als Teil dieser Analyse verwenden können. Die Lösung läuft auf EMC Greenplum- oder Teradata-Appliances sowie auf Standardhardware mit Hadoop Distributed File System (HDFS).