Zuhause Persönliche Finanzen Analyse und Extraktionstechniken für Big Data - Dummies

Analyse und Extraktionstechniken für Big Data - Dummies

Inhaltsverzeichnis:

Video: Prometheus - Goethe (Analyse und Interpretation) 2024

Video: Prometheus - Goethe (Analyse und Interpretation) 2024
Anonim

Im Allgemeinen verwenden Textanalyselösungen für Big Data eine Kombination aus statistischen und Natural Language Processing (NLP) -Techniken, um Informationen aus unstrukturierten Daten zu extrahieren. NLP ist ein weites und komplexes Gebiet, das sich in den letzten 20 Jahren entwickelt hat.

Ein primäres Ziel von NLP ist es, Bedeutung aus Text abzuleiten. Die Verarbeitung natürlicher Sprache verwendet im Allgemeinen sprachliche Konzepte wie grammatikalische Strukturen und Wortarten. Häufig besteht die Idee hinter dieser Art von Analyse darin, zu bestimmen, wer was wann, wo, wie und warum getan hat.

NLP führt eine Analyse von Text auf verschiedenen Ebenen durch:

  • Die lexikalische / morphologische Analyse untersucht die Eigenschaften eines einzelnen Wortes - einschließlich Präfixe, Suffixe, Wurzeln und Wortarten (Substantiv, Verb, Adjektiv und so weiter) - Informationen, die dazu beitragen, zu verstehen, was das Wort im Kontext des bereitgestellten Textes bedeutet. Die lexikalische Analyse hängt von einem Wörterbuch, Thesaurus oder einer Liste von Wörtern ab, die Informationen über diese Wörter bereitstellt.

  • Die syntaktische Analyse benutzt die grammatische Struktur, um den Text zu zerlegen und einzelne Wörter in einen Kontext zu bringen. Hier erweitern Sie Ihren Blick von einem einzigen Wort auf die Phrase oder den ganzen Satz. Dieser Schritt könnte die Beziehung zwischen Wörtern (die Grammatik) darstellen oder nach Folgen von Wörtern suchen, die korrekte Sätze bilden, oder nach Folgen von Zahlen, die Daten oder Geldwerte darstellen.

  • Semantische Analyse bestimmt die möglichen Bedeutungen eines Satzes. Dies kann die Untersuchung der Wortreihenfolge und der Satzstruktur sowie die Eindeutigkeit von Wörtern umfassen, indem die in den Phrasen, Sätzen und Absätzen gefundene Syntax in Beziehung gesetzt wird.

  • Discourse-Level-Analyse versucht, die Bedeutung von Text über die Satzebene hinaus zu bestimmen.

Verstehen der extrahierten Informationen aus Big Data

Bestimmte Techniken, kombiniert mit anderen statistischen oder linguistischen Techniken zur Automatisierung der Markierung und Markierung von Textdokumenten, können die folgenden Arten von Informationen extrahieren:

  • Begriffe: Name für Schlüsselwörter.

  • Entities: Oft genannte named Entities , sind spezifische Beispiele für Abstraktionen. Beispiele sind Namen von Personen, Firmennamen, geografische Standorte, Kontaktinformationen, Daten, Uhrzeiten, Währungen, Titel und Positionen usw. Zum Beispiel kann Textanalysesoftware die Entität Jane Doe als eine Person extrahieren, auf die im analysierten Text Bezug genommen wird. Die Entität 3. März 2007 kann als Datum extrahiert werden usw.

  • Fakten: Fakten, die auch als Beziehungen , bezeichnet werden, geben die who / what / where-Beziehungen zwischen zwei Entitäten an. John Smith ist der Geschäftsführer der Firma Y und Aspirin reduziert Fieber sind Beispiele für Fakten.

  • Ereignisse: Während einige Experten die Begriffe Tatsache , Beziehung , und Ereignis austauschbar verwenden, unterscheiden andere zwischen Ereignissen und Tatsachen, dass Ereignisse normalerweise eine Zeitdimension enthalten und oft dazu führen, dass sich Fakten ändern. Beispiele sind ein Wechsel im Management innerhalb eines Unternehmens oder der Status eines Verkaufsprozesses.

  • Konzepte: Dies sind Sätze von Wörtern und Ausdrücken, die auf eine bestimmte Idee oder ein Thema hinweisen, mit denen der Benutzer zu tun hat. Zum Beispiel kann das Konzept unzufriedener Kunde die Wörter wütend, enttäuscht, und verwirrt und die Begriffe Dienst trennen, nicht zurückrufen. und Geldverschwendung - unter vielen anderen. Somit kann das Konzept unzufriedener Kunde extrahiert werden, ohne dass die Wörter unglücklich oder Kunde im Text erscheinen.

  • Sentiments: Die Sentimentanalyse wird verwendet, um Standpunkte oder Emotionen im zugrunde liegenden Text zu identifizieren. Einige Techniken tun dies, indem sie Text als beispielsweise subjektiv (Meinung) oder objektiv (Tatsache) klassifizieren, wobei maschinelles Lernen oder NLP-Techniken verwendet werden. Die Sentiment-Analyse ist in Anwendungen der "Stimme des Kunden" sehr populär geworden.

Big data taxonomies

Taxonomien sind oft für die Textanalyse von entscheidender Bedeutung. Eine -Taxonomie ist eine Methode zur Organisation von Informationen in hierarchischen Beziehungen. Es wird manchmal als eine Art der Organisation von Kategorien bezeichnet. Da eine Taxonomie die Beziehungen zwischen den Begriffen definiert, die ein Unternehmen verwendet, erleichtert es das Auffinden und anschließende Analysieren von Text.

Beispielsweise bietet ein Telekommunikationsdienstanbieter sowohl einen drahtgebundenen als auch einen drahtlosen Dienst an. Innerhalb des drahtlosen Dienstes kann das Unternehmen Mobiltelefone und einen Internetzugang unterstützen. Das Unternehmen kann dann zwei oder mehr Möglichkeiten haben, Mobiltelefondienste zu kategorisieren, wie beispielsweise Pläne und Telefontypen. Die Taxonomie könnte bis zu den Teilen eines Telefons reichen.

Taxonomien können auch Synonyme und alternative Ausdrücke verwenden und erkennen, dass Mobiltelefon, Mobiltelefon und Mobiltelefon alle gleich sind. Diese Taxonomien können sehr komplex sein und lange Zeit in Anspruch nehmen.

Analyse und Extraktionstechniken für Big Data - Dummies

Die Wahl des Herausgebers

Brennen von Videos und Bildern auf DVDs mit FlipShare - Dummies

Brennen von Videos und Bildern auf DVDs mit FlipShare - Dummies

Wenn Sie eine Film oder Diashow mit der Funktion "Magic Movie" oder "Full Length" von FlipShare. Mit dem Befehl DVD erstellen von FlipShare können Sie Ihren Film oder Ihre Diashow als brennbereite Datei speichern. Wenn Sie eine Kopie Ihres Films oder Ihrer Diashow auf eine DVD brennen, können Sie eine Disc erstellen, die Sie ...

So ​​fügen Sie Ebenen zu Ihrem digitalen Film hinzu - Dummies

So ​​fügen Sie Ebenen zu Ihrem digitalen Film hinzu - Dummies

Filmen aus verschiedenen Winkeln und Ebenen kann die Stimmung beeinflussen oder Gefühl eines Schusses. Filmemacher verwenden ständig Level, um ihre Geschichte zu erzählen und die Art und Weise zu beeinflussen, wie sich das Publikum über einen Charakter fühlen sollte. Das Hinzufügen unterschiedlicher Ebenen zu Ihren Szenen bedeutet, dass Sie die Höhe der Kamera in Bezug auf Ihre ...

Wie Sie Audioprobleme in Ihrem DSLR-Film vermeiden - Dummies

Wie Sie Audioprobleme in Ihrem DSLR-Film vermeiden - Dummies

Obwohl Sie ein separates Mikrofon für Ihre DSLR verwenden Film bietet klare Vorteile, keine Form der Audioaufnahme ist problemlos. Insbesondere Standortarbeit bietet viele Dilemmata. Zum Beispiel kann das Schießen außerhalb einer kontrollierten Umgebung zu einigen klangbezogenen Problemen führen, wobei der Wind am problematischsten ist. Je nach Böen kann es ...

Die Wahl des Herausgebers

Berechnung gewichteter gleitender Durchschnitte in Excel mit exponentieller Glättung - Dummys

Berechnung gewichteter gleitender Durchschnitte in Excel mit exponentieller Glättung - Dummys

Das Werkzeug "Exponentielles Glätten" In Excel wird der gleitende Durchschnitt berechnet. Die exponentielle Glättung gewichtet jedoch die in den gleitenden Durchschnittsberechnungen enthaltenen Werte, so dass neuere Werte einen größeren Einfluss auf die Durchschnittsberechnung haben und alte Werte einen geringeren Effekt haben. Diese Gewichtung wird durch eine Glättungskonstante erreicht. So veranschaulichen Sie die Exponentialfunktion ...

ÄNdern der Spaltenbreite in Excel - Dummies

ÄNdern der Spaltenbreite in Excel - Dummies

In Excel 2013, wenn Inhalt die Breite einer Zelle überschreitet Je nach Art der Daten und je nachdem, ob die Spaltenbreite der Zelle manuell angepasst wurde, treten unterschiedliche Ergebnisse auf. In der folgenden Übung passen Sie die Zeilenhöhe auf verschiedene Arten an. Doppelklicken Sie im Arbeitsblatt auf die Trennlinie zwischen den Kopfzeilen für die Spalten A und B. ...

Berechnung des Barwerts in Excel 2013 - Dummys

Berechnung des Barwerts in Excel 2013 - Dummys

Die Funktion PV (Barwert) in Excel 2013 befindet sich im Dropdown-Menü der Finanzschaltfläche auf der Registerkarte "Formeln" der Multifunktionsleiste (Alt + MI). Die PV-Funktion gibt den Barwert einer Investition zurück, dh den Gesamtbetrag, den eine Reihe zukünftiger Zahlungen derzeit wert ist. Die Syntax der PV-Funktion lautet wie folgt: ...

Die Wahl des Herausgebers

Philosophie Themen für den Miller Analogies Test (MAT) - Dummies

Philosophie Themen für den Miller Analogies Test (MAT) - Dummies

Muss sich nicht durch verwirrende philosophische Texte wühlen, um gut mit der Philosophie auf der MAT umzugehen. Um die MAT-Analogien zur Philosophie zu übertreffen, müssen Sie nur die wichtigsten Philosophen der Geschichte, ihre Werke und einige grundlegende philosophische Begriffe kennen. Philosophische Begriffe, die auf dem MAT-Test erscheinen Auffrischen Sie Ihr Wissen ...

Anwenden von PHR / SPHR-Zertifizierungswissen auf dem Arbeitsplatz - Dummies

Anwenden von PHR / SPHR-Zertifizierungswissen auf dem Arbeitsplatz - Dummies

Nachdem Sie erfolgreich erreichte PHR / SPHR-Zertifizierung, Ihre Rolle bei der Arbeit wird sich ändern. Es ist nicht nur, weil Sie jetzt neben Ihrem Namen Initialen haben. Der Vorbereitungsprozess hat Ihnen neue Dinge beigebracht, und als der vollendete Profi, der Sie sind, werden Sie anfangen, Veränderungen in Ihrer Arbeitsgruppe zu suchen. Diese Änderungen gelten in ...

Teil I der GED - Dummies

Teil I der GED - Dummies

Teil I der Sprache Künste, schreiben Test fordert Sie auf zu lesen Überarbeiten und bearbeiten Sie dann Dokumente, die Anleitungsinformationen und Arbeitsplatzmaterial enthalten können. Dieser Test ist nicht böse. Nur weil du jahrelang keine Grammatik studiert hast, heißt das nicht, dass du es nicht weißt. Sie wissen wahrscheinlich mehr als Sie denken. Die Fragen sind alle ...