Zuhause Persönliche Finanzen Die Grenzen der Bewertungsdaten beim maschinellen Lernen - Dummies

Die Grenzen der Bewertungsdaten beim maschinellen Lernen - Dummies

Video: Xiaomi Mi Robot Vacuum Magnetband und Teppichstärke 2024

Video: Xiaomi Mi Robot Vacuum Magnetband und Teppichstärke 2024
Anonim

Rating-Daten haben ihre Grenzen beim maschinellen Lernen. Damit Empfehlungssysteme gut funktionieren, müssen sie sowohl über Sie als auch über andere Personen wissen, beides wie Sie. und anders als Sie selbst. Das Erlangen von Bewertungsdaten ermöglicht es einem Empfehlungssystem, von den Erfahrungen mehrerer Kunden zu lernen Ratingdaten könnten von einem Urteil (wie das Bewerten eines Produkts unter Verwendung von Sternen oder Zahlen) oder einem Fakt (ein binäres 1/0 einfach gibt an, dass Sie das Produkt gekauft, einen Film gesehen oder das Surfen auf einer bestimmten Webseite beendet haben.

Unabhängig von der Datenquelle oder dem Typ beziehen sich die Bewertungsdaten immer auf das Verhalten. Um einen Film bewerten zu können, müssen Sie sich entscheiden, ihn zu sehen, anzusehen und dann basierend auf Ihren Erfahrungen mit dem Film zu bewerten. Aktuelle Empfehlungssysteme lernen auf unterschiedliche Weise aus den Bewertungsdaten:

  • Kollaboratives Filtern: Übereinstimmungen Bewerter auf der Grundlage von Film- oder Produktähnlichkeiten, die in der Vergangenheit verwendet wurden. gemocht von Leuten, die dir ähnlich sind, oder von ähnlichen Gegenständen, die du magst.
  • Inhaltsbasierte Filterung: geht über die Tatsache hinaus, dass Sie einen Film angesehen haben. Es untersucht die Features in Bezug auf Sie und den Film, um festzustellen, ob eine Übereinstimmung vorhanden ist, basierend auf den größeren Kategorien, die die Features repräsentieren. Wenn Sie zum Beispiel eine Frau sind, die Actionfilme mag, wird der Empfehlungsvorschlag nach Vorschlägen suchen, die den Schnittpunkt dieser beiden Kategorien enthalten.
  • Wissensbasierte Empfehlungen: Basierend auf Metadaten, z. B. von Nutzern ausgedrückten Präferenzen und Produktbeschreibungen. Es beruht auf maschinellem Lernen und ist effektiv, wenn Sie nicht genügend Verhaltensdaten haben, um Benutzer- oder Produkteigenschaften zu bestimmen. Dies wird als Kaltstart bezeichnet und stellt eine der schwierigsten Empfehlungsaufgaben dar, da Sie keinen Zugriff auf kollaborative Filterung oder inhaltsbasierte Filterung haben.

Bei der kollaborativen Filterung müssen Sie die Ähnlichkeit berechnen. Abgesehen von Euklidischen, Manhattan- und Tschebyscheff-Entfernungen wird im Rest dieser Information die Cosinus-Ähnlichkeit diskutiert. Cosinus-Ähnlichkeit misst den Winkel-Cosinus-Abstand zwischen zwei Vektoren, was wie ein schwieriges Konzept zu erfassen scheint, aber nur eine Möglichkeit ist, Winkel in Datenräumen zu messen.

Stellen Sie sich einen Raum vor, der aus Merkmalen besteht und zwei Punkte hat. Sie können die Entfernung zwischen den Punkten messen. Zum Beispiel könnten Sie die euklidische Distanz verwenden, die eine perfekte Wahl ist, wenn Sie nur wenige Dimensionen haben, die aber kläglich versagt, wenn Sie aufgrund des Fluchs der Dimensionalität mehrere Dimensionen haben.

Die Idee hinter der Kosinusentfernung besteht darin, den Winkel zu verwenden, der von den zwei Punkten erzeugt wird, die mit dem Raumursprung (dem Punkt, an dem alle Dimensionen null sind) verbunden sind. Wenn die Punkte nahe sind, ist der Winkel eng, egal wie viele Dimensionen es gibt. Wenn sie weit weg sind, ist der Winkel ziemlich groß.

Cosinus-Ähnlichkeit implementiert die Kosinus-Distanz als Prozentsatz und ist ziemlich effektiv, um zu sagen, ob ein Benutzer einem anderen ähnlich ist oder ob ein Film mit einem anderen assoziiert werden kann, weil dieselben Benutzer ihn bevorzugen. Im folgenden Beispiel werden die Filme mit den ähnlichsten Filmen zu Film 50, Star Wars, gefunden.

drucken (colnames (MovieLense [50]))

[1] "Star Wars (1977)"

similar_movies <- Ähnlichkeit (MovieLense [50],

MovieLense [-50],

method = "cosine",

was = "Gegenstände")

colnames (similar_movies) [die (ähnliche_filme> 0.70)]

[1] "Toy Story (1995)" < "Reich schlägt zurück, die (1980)"

[3] "Jäger der verlorenen Arche (1981)"

"Rückkehr der Jedi (1983)"

Die Grenzen der Bewertungsdaten beim maschinellen Lernen - Dummies

Die Wahl des Herausgebers

Tipps für die Auswahl von Feldtypen in Access 2013 - Dummies

Tipps für die Auswahl von Feldtypen in Access 2013 - Dummies

Beim Entwerfen einer Datenbank in Access 2013 Entscheiden Sie, welcher Typ jedes Feld sein wird. Access bietet 12 Feldtypen, aus denen Sie auswählen können. Wählen Sie den Feldtyp aus, der am besten die Daten beschreibt, die Sie im Feld speichern möchten, und das funktioniert für den Analysetyp, den Sie benötigen, um die ...

Nützliche Funktionen in Access 2007 - Dummies

Nützliche Funktionen in Access 2007 - Dummies

Obwohl Access 2007 über mehrere integrierte Funktionen verfügt, dürfen Sie nicht mehr verwenden. als ein paar von ihnen in Ihren Berichten. Dennoch, wenn Sie nicht wissen, dass sie verfügbar sind, könnten Sie viele der Funktionen vermissen, die Sie wirklich nützlich finden könnten. Obwohl diese Liste weit davon entfernt ist, umfassend zu sein, zeigt diese Tabelle eine Reihe von Funktionen ...

Sichern Ihrer Access 2003-Datenbank als MDE-Datei - Dummies

Sichern Ihrer Access 2003-Datenbank als MDE-Datei - Dummies

Wenn Sie eine Access 2003-Datenbank erstellen. andere Leute - besonders Leute, die ein wenig ratlos über Access sind - Sie können Ihre Datenbank sperren, um andere Benutzer daran zu hindern, Änderungen vorzunehmen, die sie möglicherweise beschädigen. Sie können Sicherheit in Form von Benutzernamen und Passwörtern hinzufügen, aber ...

Die Wahl des Herausgebers

Ruby Datentypen und Variablen - Dummys

Ruby Datentypen und Variablen - Dummys

Variablen in Ruby werden mit alphanumerischen Zeichen und dem Unterstrich (_) bezeichnet. und kann nicht mit einer Zahl oder einem Großbuchstaben beginnen. Variablen, wie in der Algebra, sind Schlüsselwörter, die verwendet werden, um Datenwerte für eine spätere Verwendung zu speichern. Obwohl sich die in einer Variablen gespeicherten Daten ändern können, ist der Variablenname immer derselbe. Denken Sie an ...

Mit Array und Hash Built-in und verwandten Methoden - Dummies

Mit Array und Hash Built-in und verwandten Methoden - Dummies

Ruby hat viele integrierte Klassen, aber vielleicht die nützlichsten Objekte für die Speicherung anderer Daten sind die Container-Klassen Array und Hash. Sie können viel Zeit beim Codieren sparen, wenn Sie sich daran erinnern, dass jede dieser Klassen viele nützliche Methoden für den Zugriff und die Manipulation ihrer Inhalte hat. Array-Grundlagen Verwenden Sie Arrays für Listen ...

Wie man Scratch-Grafiken in andere Anwendungen exportiert - Dummies

Wie man Scratch-Grafiken in andere Anwendungen exportiert - Dummies

Scratch-Benutzer können Grafiken für andere Anwendungen entwerfen und exportieren wie Microsoft Word und PowerPoint. Eine einfach zu findende Schaltfläche (aus Datei hochladen) ermöglicht es Benutzern, Grafiken in Scratch zu importieren, aber viele Benutzer wissen nicht, wie sie Grafiken auf einem Computer speichern und die Bilder wie andere Grafikdateien exportieren können. Öffnen Sie ein Scratch-Projekt. ...

Die Wahl des Herausgebers

Hinzufügen von Fußnoten und Endnoten in Word 2016 - dummies

Hinzufügen von Fußnoten und Endnoten in Word 2016 - dummies

Fußnoten und Endnoten in Word 2016 enthalten Bonusinformationen, eine Klarstellung oder beiseite, um Text auf einer Seite zu ergänzen. Jede ist im Text durch eine hochgestellte Zahl oder einen Buchstaben gekennzeichnet1. 1 Siehe? Es klappt! Der Unterschied zwischen einer Fußnote und einer Endnote liegt in der Platzierung: Eine Fußnote wird unten angezeigt ...

Wie man Datum und Uhrzeit in Word 2013 Dokument hinzufügt - Dummies

Wie man Datum und Uhrzeit in Word 2013 Dokument hinzufügt - Dummies

Sie haben wahrscheinlich Leute Sie möchten das aktuelle Datum und die aktuelle Uhrzeit kennen oder möchten einfach das Datum oder die Uhrzeit oder beide in Ihr Word 2013-Dokument einfügen. Bis auf wenige Ausnahmen sind Zeitreisende die einzigen, die sich für das laufende Jahr erkundigen. Aber vielleicht brauchen Sie es in Ihrem Dokument ...

Wie man Datum und Uhrzeit zu einem Word 2010 Dokument hinzufügt - Dummies

Wie man Datum und Uhrzeit zu einem Word 2010 Dokument hinzufügt - Dummies

Sie wahrscheinlich haben Leute, die das aktuelle Datum und die Uhrzeit in Ihrem Word 2010-Dokument kennen möchten, oder vielleicht möchten Sie nur das Datum oder die Uhrzeit (oder beides) in Ihr Dokument einfügen. Word hat viele Tricks, um es möglich zu machen. Festhalten des aktuellen Datums oder der aktuellen Uhrzeit in einem Word-Dokument Abgesehen von der Suche ...