Inhaltsverzeichnis:
- Wie man merge benutzt, um die Schnittmenge von Daten zu finden
- Die Funktion merge () ermöglicht vier Arten der Datenkombination:
- Kehren Sie zu den Beispielen der US-Bundesstaaten zurück, um eine vollständige Zusammenführung von kalten und großen Zuständen durchzuführen, verwenden Sie merge und geben Sie all = TRUE: >> merge (cold (große Zustände, alle = TRUE) Name Frost Area 1 Alaska 152 566432 2 Arizona NA 113417 3 Kalifornien NA 156361 … 13 Texas NA 262134 14 Vermont 168 NA 15 Wyoming 173 NA
Video: Datensatz nach einer Spate sortieren in R 2024
In R verwenden Sie die Funktion merge (), um Datenrahmen zu kombinieren. Diese leistungsfähige Funktion versucht, Spalten oder Zeilen zu identifizieren, die zwischen den beiden verschiedenen Datenrahmen gemeinsam sind.
Wie man merge benutzt, um die Schnittmenge von Daten zu finden
Die einfachste Form von merge () findet den Schnittpunkt zwischen zwei verschiedenen Datensätzen. Mit anderen Worten, um einen Datenrahmen zu erstellen, der aus den Zuständen besteht, die sowohl kalt als auch groß sind, verwenden Sie die Standardversion von merge ():
Wenn Sie mit einer Datenbank vertraut sind Sprache wie SQL, haben Sie erraten, dass merge () sehr ähnlich zu einem Datenbank-Join ist. Dies ist in der Tat der Fall, und die verschiedenen Argumente, die mit merge () ausgeführt werden, ermöglichen es Ihnen, natürliche Verknüpfungen sowie linke, rechte und vollständige äußere Verknüpfungen auszuführen.
x
-
: Ein Datenrahmen. y
-
: Ein Datenrahmen. bis
-
, von. x , von. y : Die Namen der Spalten, die für x und y gemeinsam sind. Standardmäßig werden die Spalten mit gemeinsamen Namen zwischen den beiden Datenrahmen verwendet.
-
: Logische Werte, die den Typ der Zusammenführung angeben. Der Standardwert ist all = FALSE (was bedeutet, dass nur die übereinstimmenden Zeilen zurückgegeben werden). Diese letzte Gruppe von Argumenten - alles, alle. x und alles. y - verdient eine Erklärung. Diese Argumente bestimmen den Typ der Zusammenführung, der stattfinden wird.
Die verschiedenen Arten der Zusammenführung verstehen
Die Funktion merge () ermöglicht vier Arten der Datenkombination:
Natürliche Verknüpfung:
-
Um nur Zeilen beizubehalten, die von den Datenrahmen übereinstimmen, geben Sie das Argument alle = FALSCH. Voller Outer Join:
-
Um alle Zeilen von beiden Datenrahmen zu behalten, geben Sie all = TRUE an. Linker äußerer Join:
-
Um alle Zeilen Ihres Datenrahmens x und nur diejenigen von y, die übereinstimmen, einzuschließen, geben Sie all an. x = WAHR. Rechter äußerer Join:
-
Um alle Zeilen des Datenrahmens y und nur diejenigen von x, die übereinstimmen, einzuschließen, geben Sie all an. y = WAHR. So finden Sie die Union (vollständige äußere Verknüpfung)
Kehren Sie zu den Beispielen der US-Bundesstaaten zurück, um eine vollständige Zusammenführung von kalten und großen Zuständen durchzuführen, verwenden Sie merge und geben Sie all = TRUE: >> merge (cold (große Zustände, alle = TRUE) Name Frost Area 1 Alaska 152 566432 2 Arizona NA 113417 3 Kalifornien NA 156361 … 13 Texas NA 262134 14 Vermont 168 NA 15 Wyoming 173 NA
Beide Datenrahmen haben einen variablen Namen. R stimmt also mit den Fällen überein, die auf den Namen der Zustände basieren.Die Variable Frost kommt aus dem Datenrahmen kalt. Zustände, und der variable Bereich kommt aus dem Datenrahmen groß. Zustände.
Beachten Sie, dass dies die vollständige Zusammenführung durchführt und die Spalten mit NA-Werten füllt, wenn keine übereinstimmenden Daten vorhanden sind.