Zuhause Persönliche Finanzen Mit den Grundlagen von Statistik, maschinellem Lernen und mathematischen Methoden in der Datenwissenschaft - Dummies

Mit den Grundlagen von Statistik, maschinellem Lernen und mathematischen Methoden in der Datenwissenschaft - Dummies

Inhaltsverzeichnis:

Video: Blick in die Labore - Künstliche Intelligenz in der Medienanalyse, Medizin, Robotik und Produktion 2025

Video: Blick in die Labore - Künstliche Intelligenz in der Medienanalyse, Medizin, Robotik und Produktion 2025
Anonim

Teil von Data Science für Dummies Cheat Sheet > Wenn die Statistik als die Wissenschaft beschrieben wird, Erkenntnisse aus Daten abzuleiten, was ist dann der Unterschied zwischen einem Statistiker und einem Datenwissenschaftler? Gute Frage! Während viele Aufgaben in der Datenwissenschaft ein angemessenes statistisches Know-how erfordern, unterscheidet sich der Umfang und die Breite der Kenntnisse und Fertigkeiten eines Datenwissenschaftlers von denen eines Statistikers. Die Kernunterscheidungen sind unten aufgeführt.

Fachwissen:
  • Eines der Hauptmerkmale von Datenwissenschaftlern ist, dass sie ein hohes Maß an Fachwissen auf dem Gebiet bieten, auf das sie ihre Analysemethoden anwenden. Datenwissenschaftler benötigen dies, damit sie die Auswirkungen und Anwendungen der gewonnenen Datenerkenntnisse wirklich verstehen können. Ein Datenwissenschaftler sollte über ausreichende Fachkenntnisse verfügen, um die Bedeutung seiner Befunde zu ermitteln und unabhängig zu entscheiden, wie in der Analyse vorzugehen ist.

    Im Gegensatz dazu verfügen Statistiker in der Regel über eine unglaublich tiefe Kenntnis der Statistik, aber nur sehr wenig Fachwissen in den Bereichen, für die sie statistische Methoden anwenden. Die meisten Statistiker sind verpflichtet, sich mit externen Fachexperten zu beraten, um die Bedeutung ihrer Ergebnisse wirklich im Griff zu behalten und den besten Weg zu finden, um in einer Analyse voranzukommen.

    Mathematische und maschinelle Lernansätze:
  • Statistiker verlassen sich bei der Ableitung von Erkenntnissen aus Daten hauptsächlich auf statistische Methoden und Prozesse. Im Gegensatz dazu müssen Datenwissenschaftler von einer Vielzahl von Techniken Gebrauch machen, um Datenerkenntnisse abzuleiten. Dazu gehören statistische Methoden, aber auch Ansätze, die nicht in der Statistik basieren - wie etwa in Mathematik, Clustering, Klassifikation und nicht-statistischen maschinellen Lernansätzen. Die Bedeutung des statistischen Know-hows sehen

Sie müssen nicht in die Statistik gehen, um Data Science zu praktizieren, aber Sie sollten sich zumindest mit einigen der grundlegenderen Methoden vertraut machen, die verwendet werden. in der statistischen Datenanalyse. Dazu gehören:

Lineare Regression

  • : Die lineare Regression ist nützlich für die Modellierung der Beziehungen zwischen einer abhängigen Variablen und einer oder mehreren unabhängigen Variablen. Der Zweck der linearen Regression besteht darin, wichtige Korrelationen zwischen abhängigen und unabhängigen Variablen zu entdecken (und deren Stärke zu quantifizieren). Zeitreihenanalyse:

  • Bei der Zeitreihenanalyse wird eine Sammlung von Daten über Attributwerte über die Zeit analysiert, um zukünftige Instanzen der Messung basierend auf den vergangenen Beobachtungsdaten vorherzusagen. Monte-Carlo-Simulationen:

  • Die Monte Carlo-Methode ist eine Simulationstechnik, mit der Sie Hypothesen testen, Parameterschätzungen generieren, Szenarioergebnisse vorhersagen und Modelle validieren können. Die Methode ist sehr leistungsfähig, da sie sehr schnell Simulationen von 1 bis 10, 000 (oder mehr) Simulationsbeispielen für alle Prozesse simulieren kann, die Sie bewerten möchten. Statistiken für räumliche Daten:

  • Eine grundlegende und wichtige Eigenschaft räumlicher Daten ist, dass sie nicht zufällig sind. Es ist räumlich abhängig und autokorreliert. Vermeiden Sie beim Modellieren von räumlichen Daten statistische Methoden, die davon ausgehen, dass Ihre Daten zufällig sind. Kriging und krige sind zwei statistische Methoden, mit denen Sie räumliche Daten modellieren können. Diese Methoden ermöglichen es Ihnen, Vorhersageflächen für ganze Untersuchungsgebiete basierend auf Mengen von bekannten Punkten im geografischen Raum zu erstellen. Arbeiten mit Clustering-, Klassifizierungs- und maschinellen Lernmethoden

Maschinelles Lernen ist die Anwendung von Rechenalgorithmen, um aus Rohdatensätzen zu lernen (oder daraus Muster abzuleiten).

Clustering ist eine besondere Art des maschinellen Lernens - unbeaufsichtigtes maschinelles Lernen, um genau zu sein, was bedeutet, dass die Algorithmen von unbeschrifteten Daten lernen müssen und daher inferenzielle Methoden verwenden müssen, um Korrelationen. Klassifikation

wird hingegen als überwachtes maschinelles Lernen bezeichnet, was bedeutet, dass die Algorithmen von markierten Daten lernen. Die folgenden Beschreibungen führen einige der grundlegendsten Clustering- und Klassifizierungsansätze ein: k-means clustering:

  • Im Allgemeinen verwenden Sie k-means-Algorithmen, um Datenpunkte eines Datensatzes basierend auf den nächstgelegenen Mittelwerten in Cluster zu unterteilen. Um die optimale Aufteilung Ihrer Datenpunkte in Cluster zu bestimmen, so dass der Abstand zwischen Punkten in jedem Cluster minimiert wird, können Sie k-means-Clustering verwenden. Nächste Nachbaralgorithmen:

  • Der Zweck einer Nearest-Neighbour-Analyse besteht darin, entweder nach einem nächsten Punkt im Raum oder einem nächsten numerischen Wert zu suchen und ihn zu lokalisieren, abhängig von dem Attribut, das Sie für die Vergleichsgrundlage verwenden. Kerndichte-Schätzung:

  • Eine alternative Methode zum Identifizieren von Clustern in Ihren Daten ist die Verwendung einer Dichte-Glättungsfunktion. Kernel-Dichte-Schätzung (KDE) funktioniert durch Platzieren eines -Kernels einer Gewichtungsfunktion, die für die Quantifizierung der Dichte nützlich ist - an jedem Datenpunkt im Datensatz, und dann die Kernel summieren, um eine Kerndichte-Schätzung für die Gesamtheit zu erzeugen. Region. Mathematische Methoden im Mix behalten

Über den Wert von Statistiken in der Praxis der Datenwissenschaft wird viel gesagt, aber angewandte mathematische Methoden werden selten erwähnt. Offen gesagt ist die Mathematik die Grundlage aller quantitativen Analysen. Seine Bedeutung sollte nicht unterschätzt werden. Die beiden folgenden mathematischen Methoden sind besonders nützlich in der Datenwissenschaft.

Multikriterielle Entscheidungsfindung (MCDM):

  • MCDM ist ein mathematischer Entscheidungsmodellierungsansatz, den Sie verwenden können, wenn Sie mehrere Kriterien oder Alternativen haben, die Sie bei einer Entscheidung gleichzeitig bewerten müssen. Markov-Ketten

  • : Eine Markov-Kette ist eine mathematische Methode, die eine Reihe von zufällig generierten Variablen verkettet, die den gegenwärtigen Zustand repräsentieren, um zu modellieren, wie Änderungen in aktuellen Zustandsvariablen zukünftige Zustände beeinflussen.

Mit den Grundlagen von Statistik, maschinellem Lernen und mathematischen Methoden in der Datenwissenschaft - Dummies

Die Wahl des Herausgebers

Wie man Dateien in C ++ kopiert - Dummies

Wie man Dateien in C ++ kopiert - Dummies

Ah, eine Datei kopieren - etwas so einfaches, es passiert alles Zeit. Kopiere diese Datei dorthin; Kopieren Sie diese Datei hier. Aber was genau passiert, wenn Sie eine Datei kopieren? Sie erstellen tatsächlich eine neue Datei und füllen diese mit dem gleichen Inhalt wie die Originaldatei. Und wie machst du das? Nun, ...

Anleitung zum Erstellen eines Verzeichnisses in C ++ - Dummies

Anleitung zum Erstellen eines Verzeichnisses in C ++ - Dummies

Wenn Sie ein Verzeichnis erstellen möchten, können Sie das MKdir Funktion. Wenn die Funktion das Verzeichnis für Sie erstellen kann, gibt sie eine 0 zurück. Andernfalls wird ein Wert ungleich Null zurückgegeben. (Wenn Sie es ausführen, erhalten Sie eine -1, aber Ihre beste Wette - immer - ist es, gegen 0 zu testen.) Hier ist einige ...

Wie man eine einfache mathematische Vorlage in C ++ - Dummies

Wie man eine einfache mathematische Vorlage in C ++ - Dummies

Mit einer mathematischen Vorlage erstellt, die man normalerweise benötigt Zugriff auf eine Vielzahl von Berechnungen, aber nur jeweils eine oder zwei dieser Berechnungen. Zum Beispiel, wenn jemand Ihre Hypothek berechnet, muss er die Amortisationsrechnung nicht kennen. Die Person kann jedoch die Amortisationsberechnung benötigen, wenn Sie mit ...

Die Wahl des Herausgebers

ASVAB: Lesen für die Studie - Dummies

ASVAB: Lesen für die Studie - Dummies

Lesen für die Zwecke des Studiums der ASVAB ist eine andere Art des Lesens. Leseverständnis erfordert nur, dass Sie Informationen lange genug im Kurzzeitgedächtnis speichern, um einige Sekunden später eine Frage zu beantworten. Zum Lesen für die Zwecke des Studiums müssen Sie wichtige Informationen in Ihr Langzeitgedächtnis einpflegen - ...

ASVAB Mathematik Wissenspraxis: Ungleichungen - Dummies

ASVAB Mathematik Wissenspraxis: Ungleichungen - Dummies

Als wäre Algebra nicht anspruchsvoll genug, einige Fragen zur Der Subtest Mathematik auf dem ASVAB wird auch eine Ungleichheit einwerfen - nur um sicherzustellen, dass Sie aufmerksam sind. Wie erkennst du eine Ungleichheit? Halten Sie Ausschau nach Fragen mit mehr als oder weniger als Symbolen oder nach Graphen, die eine Zahlenlinie mit einem ...

ASVAB Mathematische Wissenspraxis: Fraktionen - Dummies

ASVAB Mathematische Wissenspraxis: Fraktionen - Dummies

Der Subtest Mathematikwissen auf dem ASVAB wird Fragen beinhalten, die Sie fragen mit Teilen eines Ganzen oder Fraktionen arbeiten. Diese Fragen können das Multiplizieren, Dividieren, Addieren, Subtrahieren und Konvertieren von Brüchen beinhalten, ähnlich den folgenden Übungsfragen. Übungsfragen Welche Fraktionen sind nicht gleichwertig? Gegeben einfach den Ausdruck. Antworten und Erklärungen Das richtige ...

Die Wahl des Herausgebers

Hinzufügen von Flash-Audio- und Videodateien in Dreamweaver - Dummies

Hinzufügen von Flash-Audio- und Videodateien in Dreamweaver - Dummies

Adobe besitzt sowohl Flash als auch Dreamweaver Daher finden Sie großartige Unterstützung für Flash-Dateien in Dreamweaver. Das Dialogfeld "FLV einfügen" erleichtert das Festlegen von Parametern für Flash. Dreamweaver erkennt sogar automatisch die Größe von Flash-Videodateien. Sie können Flash auch zum Erstellen und Einfügen von Audiodateien verwenden, wobei nur der Player angezeigt wird.

Einstellen von Bildhelligkeit und -kontrast in Dreamweaver - Dummies

Einstellen von Bildhelligkeit und -kontrast in Dreamweaver - Dummies

Dreamweaver bietet Werkzeuge zum Erstellen von Bildern Einstellungen, einschließlich der Helligkeit und des Kontrastes. Durch die Anpassung der Bildhelligkeit können Sie die Gesamtlichtmenge in einem Bild ändern. Kontrast steuert den Unterschied zwischen hellen und dunklen Bereichen eines Bildes. Wenn Sie die Dreamweaver-Bearbeitungswerkzeuge verwenden, wird das Bild dauerhaft geändert, wenn die Seite ...

Hinzufügen von Bildern zu Ihrer Website in Dreamweaver - Dummies

Hinzufügen von Bildern zu Ihrer Website in Dreamweaver - Dummies

Wenn Sie Ihrer Website ein Bild hinzufügen, erscheint anfangs fast magisch, weil der Prozess mit Dreamweaver so einfach ist. Die Herausforderung bei Webgrafiken besteht darin, sie nicht zu Ihren Seiten hinzuzufügen, sondern gut aussehende Bilder zu erstellen, die schnell im Browser Ihres Viewers geladen werden. Sie benötigen ein anderes Programm wie Photoshop, Photoshop Elements oder Fireworks, um ...