Video: How to Calculate Anova Using R 2024
Um eine Vorhersageanalyse auszuführen, müssen Sie die Daten in eine Form bringen, mit der der Algorithmus ein Modell erstellen kann. Dazu müssen Sie sich etwas Zeit nehmen, um die Daten zu verstehen und ihre Struktur zu kennen. Geben Sie die Funktion ein, um die Struktur der Daten herauszufinden. So sieht es aus: >> str (seeds) 'Daten. Rahmen ': 210 obs. von 8 Variablen: $ V1: num 15. 3 14. 9 14. 3 13. 8 16. 1 … $ V2: num 14. 8 14. 6 14. 1 13. 9 15 … $ V3: num 0. 871 0 881 0.905 0.895 0.903 … $ V4: num 5. 76 5. 55 5. 29 5. 32 5. 66 … $ V5: num 3. 31 3. 33 3. 34 3. 38 3. 56 … $ V6: num 2. 22 1. 02 2. 7 2. 26 1. 35 … $ V7: num 5. 22 4. 96 4. 83 4. 8 5. 17 … $ V8: int 1 1 1 1 1 1 1 1 1 1 …
Wenn Sie sich die Struktur ansehen, können Sie feststellen, dass die Daten einen Vorverarbeitungsschritt und einen Convenience-Schritt benötigen:
-
Dies ist nicht unbedingt erforderlich, aber für die Zwecke dieses Beispiels ist es bequemer, Spaltennamen zu verwenden, die Sie verstehen und sich daran erinnern können. Ändern Sie das Attribut mit kategorialen Werten in einen Faktor.
-
Das Label hat drei mögliche Kategorien. Geben Sie den folgenden Code ein, um die Spalten umzubenennen: >> colnames (seeds) <-
c ("area", "perimeter", "compactness", "length", "width", "" asymmetry "," length2 "," seedType ")
Ändern Sie als Nächstes das Attribut mit kategorialen Werten in einen Faktor. Der folgende Code ändert den Datentyp in einen Faktor:
>> samen $ seedType <- factor (samen $ seedType)
Dieser Befehl beendet die Vorbereitung der Daten für den Modellierungsprozess. Das Folgende ist eine Ansicht der Struktur nach dem Datenvorbereitungsprozess: >> str (Unkraut) 'Daten. Rahmen ': 210 obs. von 8 Variablen: $ Fläche: num 15. 3 14. 9 14. 3 13. 8 16. 1 … $ Umfang: Nummer 14. 8 14. 6 14. 1 13. 9 15 … $ Kompaktheit: num 0. 871 0 881 0.905 0.895 0.903 … $ Länge: num 5. 76 5. 55 5. 29 5. 32 5. 66 … $ Breite: num 3. 31 3. 33 3. 34 3. 38 3. 56 … $ Asymmetrie: num 2. 22 1. 02 2. 7 2. 26 1. 35 … $ length2: num 5. 22 4. 96 4. 83 4. 8 5. 17 … $ seedType: Faktor mit 3 Ebenen "1", "2", "3": 1 1 1 1 1 1 1 1 1 1 …