Zuhause Persönliche Finanzen Messung der Ähnlichkeit zwischen Vektoren für maschinelles Lernen - Dummies

Messung der Ähnlichkeit zwischen Vektoren für maschinelles Lernen - Dummies

Inhaltsverzeichnis:

Video: Data Analysis in R by Dustin Tran 2025

Video: Data Analysis in R by Dustin Tran 2025
Anonim

sehen. Sie können Beispiele aus Ihren Daten einfach mit Hilfe von Berechnungen vergleichen, wenn Sie sie als Vektor betrachten. Die folgende Information beschreibt, wie man Ähnlichkeit zwischen Vektoren misst, um Aufgaben wie das Berechnen der Entfernung zwischen Vektoren für Lernzwecke auszuführen.

Ähnlichkeit verstehen

In einer Vektorform können Sie jede Variable in Ihren Beispielen als eine Reihe von Koordinaten sehen, wobei jede Variable auf eine Position in einer anderen Raumdimension verweist. Wenn ein Vektor zwei Elemente hat, also nur zwei Variablen hat, ist das Arbeiten mit ihm genauso wie das Prüfen der Position eines Elements auf einer Karte, indem die erste Zahl für die Position auf der Ost-West-Achse und die zweite auf der Nord-Achse verwendet wird. Südachse.

Beispiele für Werte, die als Punkte in einem Diagramm dargestellt werden.

Zum Beispiel sind die Zahlen zwischen Klammern (1, 2) (3, 2) und (3, 3) alles Beispiele für Punkte. Jedes Beispiel ist eine geordnete Liste von Werten (ein Tupel genannt), die leicht lokalisiert und auf einer Karte gedruckt werden kann, wobei der erste Wert der Liste für x (die horizontale Achse) und der zweite für y (die vertikale Achse) verwendet wird. Das Ergebnis ist ein Streudiagramm.

Wenn Ihr Datensatz in Matrixform viele numerische Merkmale (die Spalten) hat, stellt die Anzahl der Features idealerweise die Dimensionen des Datenraums dar, während die Zeilen (die Beispiele) jeweils Punkt, der mathematisch ein Vektor ist. Wenn Ihr Vektor mehr als zwei Elemente hat, wird die Visualisierung mühsam, weil die Darstellung von Dimensionen über dem dritten nicht einfach ist (schließlich leben wir in einer dreidimensionalen Welt).

Sie können jedoch versuchen, mehr Dimensionalitäten durch einige Hilfsmittel zu vermitteln, z. B. durch die Verwendung von Größe, Form oder Farbe für andere Dimensionen. Klar, das ist keine einfache Aufgabe, und oft ist das Ergebnis weit davon entfernt, intuitiv zu sein. Sie können jedoch die Idee erfassen, wo sich die Punkte in Ihrem Datenraum befinden würden, indem Sie systematisch viele Diagramme drucken und dabei die Dimensionen zwei mal zwei berücksichtigen. Solche Diagramme werden Matrizen von Streudiagrammen genannt.

Mach dir keine Sorgen über Mehrdimensionalität. Sie erweitern die gelernten Regeln in zwei oder drei Dimensionen auf mehrere Dimensionen. Wenn also eine Regel in einem zweidimensionalen Raum funktioniert, funktioniert sie auch in mehreren Dimensionen. Daher beziehen sich alle Beispiele zuerst auf zweidimensionale Beispiele.

Berechnungsabstände für das Lernen

Ein Algorithmus kann lernen, indem er Vektoren von Zahlen verwendet, die Entfernungsmessungen verwenden. Oftmals ist der von Ihren Vektoren implizierte Raum ein metrischer, der ein Raum ist, dessen Abstände bestimmten Bedingungen entsprechen:

  • Es gibt keine negativen Abstände, und Ihre Entfernung ist nur dann Null, wenn der Startpunkt und der Endpunkt zusammenfallen (genannt Nichtnegativität).
  • Der Abstand ist derselbe, der von einem Punkt zum anderen geht und umgekehrt (genannt Symmetrie).
  • Der Abstand zwischen einem Anfangspunkt und einem Endpunkt ist immer größer oder schlechter als der Abstand vom Anfangspunkt zum dritten Punkt und von dort zum Endpunkt (genannt Dreiecksungleichung < - was bedeutet, dass es keine Abkürzungen gibt). Entfernungen, die einen metrischen Raum messen, sind die euklidische Distanz, die Manhattan-Distanz und die Tschebyscheff-Distanz. Dies sind alle Entfernungen, die für numerische Vektoren gelten können.

Euklidische Entfernung

Die häufigste ist die euklidische Distanz, die auch als die l2-Norm von zwei Vektoren beschrieben wird (lesen Sie diese Diskussion von l1, l2 und Linfinity-Normen). In einer zweidimensionalen Ebene stellt sich die euklidische Entfernung als die gerade Linie dar, die zwei Punkte verbindet, und Sie berechnen sie als die Quadratwurzel der Summe der quadrierten Differenz zwischen den Elementen zweier Vektoren. Im vorherigen Plot kann die Euklidische Distanz zwischen den Punkten (1, 2) und (3, 3) in R als ((1-3) ^ 2 + (2-3) ^ 2) berechnet werden, was zu einer Abstand von ungefähr 2. 236.

Manhattan-Abstand

Ein weiteres nützliches Maß ist die Manhattan-Distanz (auch als die l1-Norm von zwei Vektoren beschrieben). Sie berechnen die Manhattan-Distanz, indem Sie den absoluten Wert der Differenz zwischen den Elementen der Vektoren aufsummieren. Wenn die euklidische Distanz die kürzeste Route ist, markiert die Manhattan-Distanz die längste Route und ähnelt den Richtungen eines Taxis, das sich in einer Stadt bewegt. (Die Entfernung wird auch Taxicab oder City-Block-Entfernung genannt.)

Zum Beispiel ist die Manhattan-Distanz zwischen den Punkten (1, 2) und (3, 3) abs (1-3) und abs (2-3).), was zu 3.

Chebyshev-Abstand

führt. Der Tschebyscheff-Abstand oder die maximale Metrik nimmt das Maximum der absoluten Differenz zwischen den Elementen der Vektoren ein. Es ist ein Abstandsmaß, das darstellen kann, wie sich ein König im Schachspiel bewegt, oder in der Lagerlogistik die Operationen, die ein Brückenkran benötigt, um eine Kiste von einem Ort zum anderen zu bewegen.

Beim maschinellen Lernen kann sich die Chebyshev-Distanz als nützlich erweisen, wenn Sie viele Dimensionen berücksichtigen müssen und die meisten davon irrelevant oder überflüssig sind (in Tschebyscheff wählen Sie einfach diejenige aus, deren absoluter Unterschied am größten ist). In dem oben verwendeten Beispiel ist die Entfernung einfach 2, das Maximum zwischen (1-3) und abs (2-3).

Messung der Ähnlichkeit zwischen Vektoren für maschinelles Lernen - Dummies

Die Wahl des Herausgebers

Web Marketing: Warum Suchmaschinen existieren - Dummies

Web Marketing: Warum Suchmaschinen existieren - Dummies

Wenn Sie verstehen, warum Suchmaschinen existieren, können sie für Sie in Ihrem Web-Marketing-Geschäft arbeiten. Also, hier ist eine kurze Lektion, warum Suchmaschinen existieren und wie Sie sie nutzen können, um Geld zu verdienen. Suchmaschinen liefern Relevanz. Relevanz bedeutet, dass Besucher auf Suchergebnisse klicken und zufrieden sind mit ...

Was sind Tür- und Informationsseiten? - dummies

Was sind Tür- und Informationsseiten? - dummies

Eine Doorway-Seite wird nur als Zugang von einer Suchmaschine zu Ihrer Website erstellt. Doorway-Seiten werden manchmal als Gateway-Seiten und Geisterseiten bezeichnet. Die Idee besteht darin, hoch optimierte Seiten zu erstellen, die von Suchmaschinen aufgenommen und indiziert werden und die mit etwas Glück gut ranken und somit den Traffic auf eine ...

Was ist eine Weiterleitung bei der Suchmaschinenoptimierung? - Dummies

Was ist eine Weiterleitung bei der Suchmaschinenoptimierung? - Dummies

Eine Weiterleitung ist das automatische Laden einer Seite ohne Benutzereingriff. Sie klicken auf einen Link, um eine Webseite in Ihren Browser zu laden, und innerhalb von Sekunden verschwindet die geladene Seite, und eine neue wird angezeigt. Designer erstellen häufig Seiten für Suchmaschinen - optimierte, schlüsselwortreiche Seiten -, die Besucher auf die ...

Die Wahl des Herausgebers

Behandeln Probleme mit dem Kundenservice über Social Media - Dummies

Behandeln Probleme mit dem Kundenservice über Social Media - Dummies

, Wenn Kunden wissen, dass sie direkt mit ein Geschäft in den sozialen Medien, können sie aus einer beliebigen Anzahl von Gründen mit ihnen in Verbindung treten. Aber sobald sie merken, dass ein Problem mit dem Kundenservice oder einer Produktfrage über einen einzigen Tweet oder Beitrag angesprochen werden kann, ist es wahrscheinlicher, dass sie mit dem Unternehmen Geschäfte machen.

Acht Möglichkeiten, Social Media Feedback zu erhalten - Dummies

Acht Möglichkeiten, Social Media Feedback zu erhalten - Dummies

Die heutige Technologie verändert die Art und Weise, wie wir Geschäfte machen blitzschnell. Auch der Social-Media-Handel bewegt sich blitzschnell, aber durch die Beobachtung von Erwähnungen und Fragen an die Community können Sie einen Eindruck davon bekommen, wie Ihr Markt über bevorstehende Veränderungen denkt. Auch andere Posts können Ihnen helfen, kritisches Feedback aus der Öffentlichkeit zusammenzustellen ...

Manage Social Media Commerce mit HootSuite - dummies

Manage Social Media Commerce mit HootSuite - dummies

HootSuite ist ein Social Media Management System zur Umsetzung von Outreach und Überwachung in sozialen Netzwerken über ein einziges webbasiertes Dashboard. Für Unternehmen wird HootSuite am häufigsten von Social-Media-Teams mit mehreren Agenten verwendet, aber auch viele Einzelanwender mögen es. Wenn Sie auf der Suche nach einer robusten Plattform sind, die alles an einem Ort hält, ...

Die Wahl des Herausgebers

Die 5 Kornsterne der Mittelmeer - Dummies

Die 5 Kornsterne der Mittelmeer - Dummies

Die Mittelmeerdiät ist in der Praxis des Habens begründet ein Vollkorn zu jeder Mahlzeit. Und nein, das bedeutet nicht, eine ganze Platte Vollkornspaghetti mit Fleischsauce zum Abendessen zu essen. Stattdessen machen die Menschen im Mittelmeerraum ihr Getreide zur Beilage oder schaffen durch die Zugabe von magerem Eiweiß mehr Gleichgewicht ...

Strebe nach Gesundheit mit 7 bis 10 Portionen Obst und Gemüse - Schnuller

Strebe nach Gesundheit mit 7 bis 10 Portionen Obst und Gemüse - Schnuller

Der Verzehr von sieben bis zehn Portionen Obst und Gemüse pro Tag, wie sie für die mediterrane Ernährung empfohlen werden, mag sehr viel erscheinen, aber es muss keine so große Herausforderung sein. Wenn Sie nicht die Früchte und das Gemüse lieben, die spezifisch mit der Mittelmeerdiät verbunden sind, ist das okay! Essen Sie jede Art von Obst oder Gemüse, die Sie ...

Die gesundheitlichen Vorteile von mediterranen Kräutern und Gewürzen - Dummies

Die gesundheitlichen Vorteile von mediterranen Kräutern und Gewürzen - Dummies

Sie haben vielleicht gedacht, dass der Oregano und Basilikum in Ihrer Spaghetti-Sauce lieferte nur einen deutlichen italienischen oder mediterranen Geschmack, aber diese kleinen Kräuter sind Pflanzen, was bedeutet, dass sie alle Arten von gesundheitlichen Vorteilen haben, die einen großen Einfluss auf Ihre allgemeine Gesundheit haben können. Einfache Gewürze wie Ingwer und Oregano enthalten Phytochemikalien, ...