Video: Data Analysis in R by Dustin Tran 2024
Für die Vorhersageanalyse müssen Sie die Daten für Ihre Algorithmen laden. Das Laden des Iris-Datasets in scikit ist so einfach wie das Ausgeben von ein paar Zeilen Code, da scikit bereits eine Funktion zum Laden des Datasets erstellt hat.
Kelchblattlänge | Kelchblattbreite | Blütenblattlänge | Blütenblattbreite | Zielklasse / Etikett |
---|---|---|---|---|
5. 1 | 3. 5 | 1. 4 | 0. 2 | Setosa (0) |
7. 0 | 3. 2 | 4. 7 | 1. 4 | Versicolor (1) |
6. 3 | 3. 3 | 6. 0 | 2. 5 | Virginica (2) |
-
Öffnet eine neue interaktive Python-Shell-Sitzung.
Verwenden Sie eine neue Python-Sitzung, damit nichts im Speicher übrig bleibt und Sie mit einer sauberen Slate arbeiten können.
-
Geben Sie den folgenden Code in die Eingabeaufforderung ein und beobachten Sie die Ausgabe: >>>> from sklearn. Datensätze importieren load_iris >>> iris = load_iris ()
Nach Ausführung dieser beiden Anweisungen sollten Sie keine Meldungen vom Interpreter sehen. Die variable Iris sollte alle Daten von der Iris enthalten. CSV-Datei.
Die Ausgabe ist der gesamte Inhalt der Iris. csv-Datei zusammen mit einigen anderen Informationen über das Dataset, das die Funktion load_iris in die Variable geladen hat. Die Variable ist eine Dictionary-Datenstruktur mit vier Haupteigenschaften. Die wichtigen Eigenschaften der Iris sind unten aufgeführt.
Name der Eigenschaft
Beschreibungdata | Enthält alle Messungen der Beobachtungen. |
---|---|
feature_name | Enthält den Namen des Features (Attributname). |
target | Enthält alle Ziele (Labels) der Beobachtungen. |
target_names | Enthält die Namen der Klassen. |
Sie können die Werte im Interpreter ausdrucken, indem Sie den Variablennamen gefolgt von einem Punkt gefolgt von einem Eigenschaftsnamen eingeben. Ein Beispiel ist Iris. Daten zum Zugriff auf die Eigenschaft der Iris, wie folgt: >>>> Iris. data | Dies ist eine Standardmethode für den Zugriff auf Eigenschaften eines Objekts in vielen Programmiersprachen. |
Um eine Instanz des SVM-Klassifikators zu erstellen, geben Sie den folgenden Code in den Interpreter ein: >>>> from sklearn. svm import LinearSVC >>> svmClassifier = LinearSVC (random_state = 111)
Die erste Codezeile importiert die lineare SVC-Bibliothek in die Sitzung. Der lineare Support Vector Classifier (SVC) ist eine Implementierung von SVM für die lineare Klassifizierung und unterstützt mehrere Klassen.Das Dataset ist etwas linear trennbar und hat drei Klassen. Daher wäre es eine gute Idee, mit Linear SVC zu experimentieren, um zu sehen, wie es funktioniert.
Die zweite Zeile erstellt die Instanz mit der Variablen svmClassifier. Dies ist eine wichtige Variable, an die Sie sich erinnern sollten. Mit dem Parameter random_state können Sie diese Beispiele reproduzieren und dieselben Ergebnisse erzielen. Wenn Sie den Parameter random_state nicht angegeben haben, können die Ergebnisse von den hier gezeigten Ergebnissen abweichen.