Zuhause Persönliche Finanzen Messung der Ähnlichkeit zwischen Vektoren für maschinelles Lernen - Dummies

Messung der Ähnlichkeit zwischen Vektoren für maschinelles Lernen - Dummies

Inhaltsverzeichnis:

Video: Data Analysis in R by Dustin Tran 2025

Video: Data Analysis in R by Dustin Tran 2025
Anonim

sehen. Sie können Beispiele aus Ihren Daten einfach mit Hilfe von Berechnungen vergleichen, wenn Sie sie als Vektor betrachten. Die folgende Information beschreibt, wie man Ähnlichkeit zwischen Vektoren misst, um Aufgaben wie das Berechnen der Entfernung zwischen Vektoren für Lernzwecke auszuführen.

Ähnlichkeit verstehen

In einer Vektorform können Sie jede Variable in Ihren Beispielen als eine Reihe von Koordinaten sehen, wobei jede Variable auf eine Position in einer anderen Raumdimension verweist. Wenn ein Vektor zwei Elemente hat, also nur zwei Variablen hat, ist das Arbeiten mit ihm genauso wie das Prüfen der Position eines Elements auf einer Karte, indem die erste Zahl für die Position auf der Ost-West-Achse und die zweite auf der Nord-Achse verwendet wird. Südachse.

Beispiele für Werte, die als Punkte in einem Diagramm dargestellt werden.

Zum Beispiel sind die Zahlen zwischen Klammern (1, 2) (3, 2) und (3, 3) alles Beispiele für Punkte. Jedes Beispiel ist eine geordnete Liste von Werten (ein Tupel genannt), die leicht lokalisiert und auf einer Karte gedruckt werden kann, wobei der erste Wert der Liste für x (die horizontale Achse) und der zweite für y (die vertikale Achse) verwendet wird. Das Ergebnis ist ein Streudiagramm.

Wenn Ihr Datensatz in Matrixform viele numerische Merkmale (die Spalten) hat, stellt die Anzahl der Features idealerweise die Dimensionen des Datenraums dar, während die Zeilen (die Beispiele) jeweils Punkt, der mathematisch ein Vektor ist. Wenn Ihr Vektor mehr als zwei Elemente hat, wird die Visualisierung mühsam, weil die Darstellung von Dimensionen über dem dritten nicht einfach ist (schließlich leben wir in einer dreidimensionalen Welt).

Sie können jedoch versuchen, mehr Dimensionalitäten durch einige Hilfsmittel zu vermitteln, z. B. durch die Verwendung von Größe, Form oder Farbe für andere Dimensionen. Klar, das ist keine einfache Aufgabe, und oft ist das Ergebnis weit davon entfernt, intuitiv zu sein. Sie können jedoch die Idee erfassen, wo sich die Punkte in Ihrem Datenraum befinden würden, indem Sie systematisch viele Diagramme drucken und dabei die Dimensionen zwei mal zwei berücksichtigen. Solche Diagramme werden Matrizen von Streudiagrammen genannt.

Mach dir keine Sorgen über Mehrdimensionalität. Sie erweitern die gelernten Regeln in zwei oder drei Dimensionen auf mehrere Dimensionen. Wenn also eine Regel in einem zweidimensionalen Raum funktioniert, funktioniert sie auch in mehreren Dimensionen. Daher beziehen sich alle Beispiele zuerst auf zweidimensionale Beispiele.

Berechnungsabstände für das Lernen

Ein Algorithmus kann lernen, indem er Vektoren von Zahlen verwendet, die Entfernungsmessungen verwenden. Oftmals ist der von Ihren Vektoren implizierte Raum ein metrischer, der ein Raum ist, dessen Abstände bestimmten Bedingungen entsprechen:

  • Es gibt keine negativen Abstände, und Ihre Entfernung ist nur dann Null, wenn der Startpunkt und der Endpunkt zusammenfallen (genannt Nichtnegativität).
  • Der Abstand ist derselbe, der von einem Punkt zum anderen geht und umgekehrt (genannt Symmetrie).
  • Der Abstand zwischen einem Anfangspunkt und einem Endpunkt ist immer größer oder schlechter als der Abstand vom Anfangspunkt zum dritten Punkt und von dort zum Endpunkt (genannt Dreiecksungleichung < - was bedeutet, dass es keine Abkürzungen gibt). Entfernungen, die einen metrischen Raum messen, sind die euklidische Distanz, die Manhattan-Distanz und die Tschebyscheff-Distanz. Dies sind alle Entfernungen, die für numerische Vektoren gelten können.

Euklidische Entfernung

Die häufigste ist die euklidische Distanz, die auch als die l2-Norm von zwei Vektoren beschrieben wird (lesen Sie diese Diskussion von l1, l2 und Linfinity-Normen). In einer zweidimensionalen Ebene stellt sich die euklidische Entfernung als die gerade Linie dar, die zwei Punkte verbindet, und Sie berechnen sie als die Quadratwurzel der Summe der quadrierten Differenz zwischen den Elementen zweier Vektoren. Im vorherigen Plot kann die Euklidische Distanz zwischen den Punkten (1, 2) und (3, 3) in R als ((1-3) ^ 2 + (2-3) ^ 2) berechnet werden, was zu einer Abstand von ungefähr 2. 236.

Manhattan-Abstand

Ein weiteres nützliches Maß ist die Manhattan-Distanz (auch als die l1-Norm von zwei Vektoren beschrieben). Sie berechnen die Manhattan-Distanz, indem Sie den absoluten Wert der Differenz zwischen den Elementen der Vektoren aufsummieren. Wenn die euklidische Distanz die kürzeste Route ist, markiert die Manhattan-Distanz die längste Route und ähnelt den Richtungen eines Taxis, das sich in einer Stadt bewegt. (Die Entfernung wird auch Taxicab oder City-Block-Entfernung genannt.)

Zum Beispiel ist die Manhattan-Distanz zwischen den Punkten (1, 2) und (3, 3) abs (1-3) und abs (2-3).), was zu 3.

Chebyshev-Abstand

führt. Der Tschebyscheff-Abstand oder die maximale Metrik nimmt das Maximum der absoluten Differenz zwischen den Elementen der Vektoren ein. Es ist ein Abstandsmaß, das darstellen kann, wie sich ein König im Schachspiel bewegt, oder in der Lagerlogistik die Operationen, die ein Brückenkran benötigt, um eine Kiste von einem Ort zum anderen zu bewegen.

Beim maschinellen Lernen kann sich die Chebyshev-Distanz als nützlich erweisen, wenn Sie viele Dimensionen berücksichtigen müssen und die meisten davon irrelevant oder überflüssig sind (in Tschebyscheff wählen Sie einfach diejenige aus, deren absoluter Unterschied am größten ist). In dem oben verwendeten Beispiel ist die Entfernung einfach 2, das Maximum zwischen (1-3) und abs (2-3).

Messung der Ähnlichkeit zwischen Vektoren für maschinelles Lernen - Dummies

Die Wahl des Herausgebers

Auflistung Vereinbarungen über die Immobilienlizenz Prüfung - Dummies

Auflistung Vereinbarungen über die Immobilienlizenz Prüfung - Dummies

Listing-Vereinbarungen werden auf der Immobilien abgedeckt werden Lizenzprüfung. Eine Listungsvereinbarung stellt eine Agenturbeziehung zwischen einem Agenten und einem Grundstücksverkäufer her. Der Vertreter verpflichtet sich, den Verkäufer bei der Vermarktung der Immobilie zu vertreten. Hier sind die Namen und Beschreibungen der vier Arten von Listing-Vereinbarungen in der Reihenfolge, in der sie sind ...

Immobilien-Lizenz-Prüfung: 7 Verwirrende Wortpaare - Dummies

Immobilien-Lizenz-Prüfung: 7 Verwirrende Wortpaare - Dummies

Bevor Sie Ihre Immobilienlizenz nehmen Es ist wichtig, dass Sie den Unterschied zwischen ähnlich klingenden Begriffen verstehen. Die folgenden Immobilienbegriffe sind am häufigsten verwirrt; Holen Sie sich diese auswendig und Sie sind auf dem Weg zu mehr richtigen Antworten. Eigentumswohnung / Genossenschaft: Ein Eigentümer einer Eigentumswohnung besitzt tatsächlich Immobilien. Dieser Besitz ist in der Regel der Luftraum ...

Hypothek Akzeptanz Überlegungen zur Immobilienlizenz Prüfung - Dummies

Hypothek Akzeptanz Überlegungen zur Immobilienlizenz Prüfung - Dummies

Die Immobilienlizenz Prüfung wird Fragen zu Hypotheken und Kreditgebern. Ein primärer Kreditgeber hat zwei Überlegungen, wenn er einen Kredit für den Kauf oder die Refinanzierung von Immobilien vergibt: den Wert der Immobilie und die Fähigkeit des Kreditnehmers, die Schulden zu tilgen. Bei der Überprüfung des Wertes der Immobilie, ...

Die Wahl des Herausgebers

GED Fragen der wissenschaftlichen Praxis: Arbeit, Bewegung und Kraft - Dummies

GED Fragen der wissenschaftlichen Praxis: Arbeit, Bewegung und Kraft - Dummies

Die Gesetze von Physik beeinflusst alle Arten von alltäglichen Aktivitäten, vom Autofahren bis zum Baseballspiel. Es überrascht daher nicht, dass sich einige Fragen zum GED Science-Test mit Konzepten wie Arbeit, Bewegung und Kraft befassen. In den folgenden Übungsfragen müssen Sie sowohl Theorie als auch gesunden Menschenverstand anwenden, um ...

GED Beispielfragen: Argumentieren durch Sprachkunst Lesen von technischen Informationen - Dummies

GED Beispielfragen: Argumentieren durch Sprachkunst Lesen von technischen Informationen - Dummies

Zu den Begründungen Durch die Sprachabteilung der GED können Sie gebeten werden, Fragen zu einer technischen Passage zu beantworten. Dies könnte Anweisungen zur Fertigstellung enthalten, wie die folgenden. Die Fragen in diesem Artikel beziehen sich auf den folgenden Auszug aus Russell Harts Fotografie für Dummies, 2. Auflage (Wiley). Was ist das Geheimnis für ...?

GED Beispielfragen: Kurze wissenschaftliche Antwortfragen - Dummys

GED Beispielfragen: Kurze wissenschaftliche Antwortfragen - Dummys

Irgendwann während des Science-Teils der GEE-Test, werden Sie gebeten, eine kurze Antwort zu verfassen. Sie werden eine Passage erhalten und eine Frage stellen, auf die Sie antworten müssen. Machen Sie Ihre Antwort klar und prägnant. Kurzer Antwortdurchgang Jeder kennt Cheddar-Käse. Leute setzen ...

Die Wahl des Herausgebers

Stärkung des Selbstwertgefühls für Dummies Cheat Sheet (UK Edition) - Dummies

Stärkung des Selbstwertgefühls für Dummies Cheat Sheet (UK Edition) - Dummies

Selbstzweifel und schlechte Selbstwertschätzung scheinen Hand in Hand mit dem Menschsein zu gehen. Selbst wenn Sie im Allgemeinen gesund und ein gutes Selbstwertgefühl haben, haben Sie wahrscheinlich Zeiten in Ihrem Leben, an denen Sie sich unwohl fühlen und Gedanken und Gedanken über sich selbst verunglimpfen. Um zu helfen, halten Sie diesen Spickzettel, damit Sie ein paar Tipps und Hinweise haben ...

Antipsychotika und die Behandlung der bipolaren Störung - Dummies

Antipsychotika und die Behandlung der bipolaren Störung - Dummies

Atypische Antipsychotika (atypische Neuroleptika oder Antipsychotika der zweiten Generation) ursprünglich formuliert, um Psychose bei Schizophrenie zu behandeln, aber diese Klasse von Medikamenten hat sich auch als wirksam bei der Verringerung der Manie und Augmentierung Antidepressiva Behandlung erwiesen. Die atypische oder zweite Generation stammt aus der Tatsache, dass diese neuere Art von Antipsychotika anders funktioniert als der ältere Standard oder Neuroleptika der ersten Generation, ...

Verwaltung von Angst mit Achtsamkeit für Dummies Cheat Sheet - Dummies

Verwaltung von Angst mit Achtsamkeit für Dummies Cheat Sheet - Dummies

Sie möchten mehr darüber erfahren, wie Sie Ihre Angst mit Achtsamkeit? Sieh dir den Spickzettel an und entdecke die häufigsten Ursachen von Angstzuständen. Versuchen Sie eine kurze Achtsamkeitsübung, die Ihrer Angst helfen kann. Erkunde Wege, wie du deine ängstlichen Gedanken achtsam handhaben kannst. Finden Sie einfache Möglichkeiten heraus, jeden Tag aufmerksam zu sein. Dieser Spickzettel ...