Zuhause Persönliche Finanzen Analyse und Extraktionstechniken für Big Data - Dummies

Analyse und Extraktionstechniken für Big Data - Dummies

Inhaltsverzeichnis:

Video: Prometheus - Goethe (Analyse und Interpretation) 2025

Video: Prometheus - Goethe (Analyse und Interpretation) 2025
Anonim

Im Allgemeinen verwenden Textanalyselösungen für Big Data eine Kombination aus statistischen und Natural Language Processing (NLP) -Techniken, um Informationen aus unstrukturierten Daten zu extrahieren. NLP ist ein weites und komplexes Gebiet, das sich in den letzten 20 Jahren entwickelt hat.

Ein primäres Ziel von NLP ist es, Bedeutung aus Text abzuleiten. Die Verarbeitung natürlicher Sprache verwendet im Allgemeinen sprachliche Konzepte wie grammatikalische Strukturen und Wortarten. Häufig besteht die Idee hinter dieser Art von Analyse darin, zu bestimmen, wer was wann, wo, wie und warum getan hat.

NLP führt eine Analyse von Text auf verschiedenen Ebenen durch:

  • Die lexikalische / morphologische Analyse untersucht die Eigenschaften eines einzelnen Wortes - einschließlich Präfixe, Suffixe, Wurzeln und Wortarten (Substantiv, Verb, Adjektiv und so weiter) - Informationen, die dazu beitragen, zu verstehen, was das Wort im Kontext des bereitgestellten Textes bedeutet. Die lexikalische Analyse hängt von einem Wörterbuch, Thesaurus oder einer Liste von Wörtern ab, die Informationen über diese Wörter bereitstellt.

  • Die syntaktische Analyse benutzt die grammatische Struktur, um den Text zu zerlegen und einzelne Wörter in einen Kontext zu bringen. Hier erweitern Sie Ihren Blick von einem einzigen Wort auf die Phrase oder den ganzen Satz. Dieser Schritt könnte die Beziehung zwischen Wörtern (die Grammatik) darstellen oder nach Folgen von Wörtern suchen, die korrekte Sätze bilden, oder nach Folgen von Zahlen, die Daten oder Geldwerte darstellen.

  • Semantische Analyse bestimmt die möglichen Bedeutungen eines Satzes. Dies kann die Untersuchung der Wortreihenfolge und der Satzstruktur sowie die Eindeutigkeit von Wörtern umfassen, indem die in den Phrasen, Sätzen und Absätzen gefundene Syntax in Beziehung gesetzt wird.

  • Discourse-Level-Analyse versucht, die Bedeutung von Text über die Satzebene hinaus zu bestimmen.

Verstehen der extrahierten Informationen aus Big Data

Bestimmte Techniken, kombiniert mit anderen statistischen oder linguistischen Techniken zur Automatisierung der Markierung und Markierung von Textdokumenten, können die folgenden Arten von Informationen extrahieren:

  • Begriffe: Name für Schlüsselwörter.

  • Entities: Oft genannte named Entities , sind spezifische Beispiele für Abstraktionen. Beispiele sind Namen von Personen, Firmennamen, geografische Standorte, Kontaktinformationen, Daten, Uhrzeiten, Währungen, Titel und Positionen usw. Zum Beispiel kann Textanalysesoftware die Entität Jane Doe als eine Person extrahieren, auf die im analysierten Text Bezug genommen wird. Die Entität 3. März 2007 kann als Datum extrahiert werden usw.

  • Fakten: Fakten, die auch als Beziehungen , bezeichnet werden, geben die who / what / where-Beziehungen zwischen zwei Entitäten an. John Smith ist der Geschäftsführer der Firma Y und Aspirin reduziert Fieber sind Beispiele für Fakten.

  • Ereignisse: Während einige Experten die Begriffe Tatsache , Beziehung , und Ereignis austauschbar verwenden, unterscheiden andere zwischen Ereignissen und Tatsachen, dass Ereignisse normalerweise eine Zeitdimension enthalten und oft dazu führen, dass sich Fakten ändern. Beispiele sind ein Wechsel im Management innerhalb eines Unternehmens oder der Status eines Verkaufsprozesses.

  • Konzepte: Dies sind Sätze von Wörtern und Ausdrücken, die auf eine bestimmte Idee oder ein Thema hinweisen, mit denen der Benutzer zu tun hat. Zum Beispiel kann das Konzept unzufriedener Kunde die Wörter wütend, enttäuscht, und verwirrt und die Begriffe Dienst trennen, nicht zurückrufen. und Geldverschwendung - unter vielen anderen. Somit kann das Konzept unzufriedener Kunde extrahiert werden, ohne dass die Wörter unglücklich oder Kunde im Text erscheinen.

  • Sentiments: Die Sentimentanalyse wird verwendet, um Standpunkte oder Emotionen im zugrunde liegenden Text zu identifizieren. Einige Techniken tun dies, indem sie Text als beispielsweise subjektiv (Meinung) oder objektiv (Tatsache) klassifizieren, wobei maschinelles Lernen oder NLP-Techniken verwendet werden. Die Sentiment-Analyse ist in Anwendungen der "Stimme des Kunden" sehr populär geworden.

Big data taxonomies

Taxonomien sind oft für die Textanalyse von entscheidender Bedeutung. Eine -Taxonomie ist eine Methode zur Organisation von Informationen in hierarchischen Beziehungen. Es wird manchmal als eine Art der Organisation von Kategorien bezeichnet. Da eine Taxonomie die Beziehungen zwischen den Begriffen definiert, die ein Unternehmen verwendet, erleichtert es das Auffinden und anschließende Analysieren von Text.

Beispielsweise bietet ein Telekommunikationsdienstanbieter sowohl einen drahtgebundenen als auch einen drahtlosen Dienst an. Innerhalb des drahtlosen Dienstes kann das Unternehmen Mobiltelefone und einen Internetzugang unterstützen. Das Unternehmen kann dann zwei oder mehr Möglichkeiten haben, Mobiltelefondienste zu kategorisieren, wie beispielsweise Pläne und Telefontypen. Die Taxonomie könnte bis zu den Teilen eines Telefons reichen.

Taxonomien können auch Synonyme und alternative Ausdrücke verwenden und erkennen, dass Mobiltelefon, Mobiltelefon und Mobiltelefon alle gleich sind. Diese Taxonomien können sehr komplex sein und lange Zeit in Anspruch nehmen.

Analyse und Extraktionstechniken für Big Data - Dummies

Die Wahl des Herausgebers

Web Marketing: Warum Suchmaschinen existieren - Dummies

Web Marketing: Warum Suchmaschinen existieren - Dummies

Wenn Sie verstehen, warum Suchmaschinen existieren, können sie für Sie in Ihrem Web-Marketing-Geschäft arbeiten. Also, hier ist eine kurze Lektion, warum Suchmaschinen existieren und wie Sie sie nutzen können, um Geld zu verdienen. Suchmaschinen liefern Relevanz. Relevanz bedeutet, dass Besucher auf Suchergebnisse klicken und zufrieden sind mit ...

Was sind Tür- und Informationsseiten? - dummies

Was sind Tür- und Informationsseiten? - dummies

Eine Doorway-Seite wird nur als Zugang von einer Suchmaschine zu Ihrer Website erstellt. Doorway-Seiten werden manchmal als Gateway-Seiten und Geisterseiten bezeichnet. Die Idee besteht darin, hoch optimierte Seiten zu erstellen, die von Suchmaschinen aufgenommen und indiziert werden und die mit etwas Glück gut ranken und somit den Traffic auf eine ...

Was ist eine Weiterleitung bei der Suchmaschinenoptimierung? - Dummies

Was ist eine Weiterleitung bei der Suchmaschinenoptimierung? - Dummies

Eine Weiterleitung ist das automatische Laden einer Seite ohne Benutzereingriff. Sie klicken auf einen Link, um eine Webseite in Ihren Browser zu laden, und innerhalb von Sekunden verschwindet die geladene Seite, und eine neue wird angezeigt. Designer erstellen häufig Seiten für Suchmaschinen - optimierte, schlüsselwortreiche Seiten -, die Besucher auf die ...

Die Wahl des Herausgebers

Behandeln Probleme mit dem Kundenservice über Social Media - Dummies

Behandeln Probleme mit dem Kundenservice über Social Media - Dummies

, Wenn Kunden wissen, dass sie direkt mit ein Geschäft in den sozialen Medien, können sie aus einer beliebigen Anzahl von Gründen mit ihnen in Verbindung treten. Aber sobald sie merken, dass ein Problem mit dem Kundenservice oder einer Produktfrage über einen einzigen Tweet oder Beitrag angesprochen werden kann, ist es wahrscheinlicher, dass sie mit dem Unternehmen Geschäfte machen.

Acht Möglichkeiten, Social Media Feedback zu erhalten - Dummies

Acht Möglichkeiten, Social Media Feedback zu erhalten - Dummies

Die heutige Technologie verändert die Art und Weise, wie wir Geschäfte machen blitzschnell. Auch der Social-Media-Handel bewegt sich blitzschnell, aber durch die Beobachtung von Erwähnungen und Fragen an die Community können Sie einen Eindruck davon bekommen, wie Ihr Markt über bevorstehende Veränderungen denkt. Auch andere Posts können Ihnen helfen, kritisches Feedback aus der Öffentlichkeit zusammenzustellen ...

Manage Social Media Commerce mit HootSuite - dummies

Manage Social Media Commerce mit HootSuite - dummies

HootSuite ist ein Social Media Management System zur Umsetzung von Outreach und Überwachung in sozialen Netzwerken über ein einziges webbasiertes Dashboard. Für Unternehmen wird HootSuite am häufigsten von Social-Media-Teams mit mehreren Agenten verwendet, aber auch viele Einzelanwender mögen es. Wenn Sie auf der Suche nach einer robusten Plattform sind, die alles an einem Ort hält, ...

Die Wahl des Herausgebers

Die 5 Kornsterne der Mittelmeer - Dummies

Die 5 Kornsterne der Mittelmeer - Dummies

Die Mittelmeerdiät ist in der Praxis des Habens begründet ein Vollkorn zu jeder Mahlzeit. Und nein, das bedeutet nicht, eine ganze Platte Vollkornspaghetti mit Fleischsauce zum Abendessen zu essen. Stattdessen machen die Menschen im Mittelmeerraum ihr Getreide zur Beilage oder schaffen durch die Zugabe von magerem Eiweiß mehr Gleichgewicht ...

Strebe nach Gesundheit mit 7 bis 10 Portionen Obst und Gemüse - Schnuller

Strebe nach Gesundheit mit 7 bis 10 Portionen Obst und Gemüse - Schnuller

Der Verzehr von sieben bis zehn Portionen Obst und Gemüse pro Tag, wie sie für die mediterrane Ernährung empfohlen werden, mag sehr viel erscheinen, aber es muss keine so große Herausforderung sein. Wenn Sie nicht die Früchte und das Gemüse lieben, die spezifisch mit der Mittelmeerdiät verbunden sind, ist das okay! Essen Sie jede Art von Obst oder Gemüse, die Sie ...

Die gesundheitlichen Vorteile von mediterranen Kräutern und Gewürzen - Dummies

Die gesundheitlichen Vorteile von mediterranen Kräutern und Gewürzen - Dummies

Sie haben vielleicht gedacht, dass der Oregano und Basilikum in Ihrer Spaghetti-Sauce lieferte nur einen deutlichen italienischen oder mediterranen Geschmack, aber diese kleinen Kräuter sind Pflanzen, was bedeutet, dass sie alle Arten von gesundheitlichen Vorteilen haben, die einen großen Einfluss auf Ihre allgemeine Gesundheit haben können. Einfache Gewürze wie Ingwer und Oregano enthalten Phytochemikalien, ...