Video: CSV-Dateien in R 2024
Eine der einfachsten und zuverlässigsten Wie man Daten in R erhält, ist die Verwendung von Textdateien, insbesondere CSV-Dateien (Comma-Separated Values). Das CSV-Dateiformat verwendet Kommas, um die verschiedenen Elemente in einer Zeile zu trennen, und jede Datenzeile befindet sich in einer eigenen Zeile in der Textdatei, was CSV-Dateien ideal für die Darstellung von Tabellendaten macht.
Der zusätzliche Vorteil von CSV-Dateien besteht darin, dass fast jede Datenanwendung den Export von Daten in das CSV-Format unterstützt. Dies ist sicherlich der Fall für die meisten Tabellenkalkulationsanwendungen, einschließlich Microsoft Excel und OpenOffice Calc.
Nehmen Sie in den folgenden Beispielen an, dass Sie eine CSV-Datei in einem geeigneten Ordner in Ihrem Dateisystem gespeichert haben. Um eine Excel-Tabelle in das CSV-Format zu konvertieren, müssen Sie Datei → Speichern unter auswählen, wodurch Sie die Möglichkeit haben, Ihre Datei in verschiedenen Formaten zu speichern.
Beachten Sie, dass eine CSV-Datei nur ein einzelnes Arbeitsblatt einer Tabelle darstellen kann. Verwenden Sie abschließend die oberste Zeile Ihres Arbeitsblatts (Zeile 1) für die Spaltenüberschriften.
In R verwenden Sie das Lesen. csv () Funktion zum Importieren von Daten im CSV-Format. Diese Funktion hat eine Reihe von Argumenten, aber das einzige wesentliche Argument ist file, das den Speicherort und den Dateinamen angibt. So lesen Sie eine Datei namens Elemente. csv befindet sich bei f: use read. csv () mit Datei. Pfad: >> Elemente str (Elemente) 'Daten. Rahmen ': 10 obs. von 9 Variablen: $ Atomic. Nummer: int 1 2 3 4 5 6 7 8 9 10 $ Name: Faktor mit 10 Stufen "Beryllium", "Boron", …: 6 5 7 1 2 3 9 10 4 8 $ Symbol: Faktor mit 10 Stufen " B "," Be "," C "," F ", …: 5 6 7 2 1 3 8 10 4 9 $ Gruppe: int 1 18 1 2 13 14 15 16 17 18 $ Periode: int 1 1 2 2 2 2 2 2 2 2 $ Block: Faktor mit 2 Stufen "p", "s": 2 2 2 2 1 1 1 1 1 1 $ Status. beim. STP: Faktor mit 2 Stufen "Gas", "Solid": 1 1 2 2 2 2 1 1 1 1 $ Vorkommen: Faktor w / 1 Ebene "Primordial": 1 1 1 1 1 1 1 1 1 1 $ Beschreibung: Faktor w / 6 Stufen "Alkalimetall", …: 6 5 1 2 4 6 6 6 3 5
R importiert die Daten in einen Datenrahmen. Wie Sie sehen können, hat dieses Beispiel zehn Beobachtungen von neun Variablen.
Diese Standardoption für die Konvertierung von Strings in Faktoren bei Verwendung von read. Tabelle () kann eine große Verwirrung hervorrufen. Sie sollten oft Daten importieren, die Zeichenfolgen so enthalten, dass die Zeichenfolgen keine konvertierten Faktoren sind, sondern Zeichenvektoren bleiben.Verwenden Sie zum Importieren von Daten, die Zeichenfolgen enthalten, das Argument stringsAsFactors = FALSE zum Lesen. csv () oder lesen. table ():