Video: Microsoft Azure OpenDev—June 2017 2024
überwacht werden kann. In überwachte Analytik, beide Eingaben und die bevorzugte Ausgabe ist ein Teil der Trainingsdaten. Das Vorhersageanalysemodell wird im Rahmen seines Lernprozesses mit den richtigen Ergebnissen präsentiert. Ein derartiges überwachtes Lernen setzt vorklassifizierte Beispiele voraus: Das Ziel besteht darin, das Modell von der zuvor bekannten Klassifikation lernen zu lassen, damit es den nächsten unbekannten Datenpunkt korrekt beschriften kann, basierend auf dem, was es gelernt hat.
Wenn das Training des Modells abgeschlossen ist, wird eine mathematische Funktion durch die Untersuchung der Trainingsdaten abgeleitet. Diese Funktion wird zum Beschriften neuer Datenpunkte verwendet.
Damit diese Vorgehensweise korrekt funktioniert, müssen die Trainingsdaten zusammen mit den Testdaten sorgfältig ausgewählt werden. Das trainierte Modell sollte in der Lage sein, die korrekte Bezeichnung für einen neuen Datenpunkt schnell und präzise vorherzusagen, basierend auf dem Datentyp, den das Modell in den Trainingsdaten gesehen hat.
Überwachte Analytik bietet einige entscheidende Vorteile:
-
Der Analytiker ist für den Prozess verantwortlich.
-
Die Kennzeichnung basiert auf bekannten Klassifizierungen.
-
Beschriftungsfehler können leicht behoben werden.
Die Kehrseite dieser Vorteile ist ein ebenso ausgeprägter Satz von möglichen Nachteilen:
-
Irgendwelche Fehler in der Trainingsphase werden später verstärkt.
-
Die vom Analytiker gelieferte Klassifizierung beschreibt möglicherweise nicht die gesamte Bevölkerung adäquat.
-
Das Modell kann möglicherweise keine Klassen erkennen, die vom ursprünglichen Trainingssatz abweichen.
-
Die Annahme, dass sich die Cluster innerhalb der Daten nicht überschneiden - und dass sie leicht getrennt werden können - kann sich nicht als gültig erweisen.