Video: Koordinaten angeben so machen Sie es richtig 2024
Wenn es um die Umformung von Daten in R geht, ist es wichtig, Daten in langen und breiten Formaten zu erkennen. Diese visuellen Metaphern beschreiben zwei Arten der Darstellung derselben Information. Es ist hilfreich, diese Formate bei der Verwendung von R zu kennen.
Sie können Daten im Großformat erkennen, da Spalten im Allgemeinen Gruppen darstellen. Also, unser Beispiel von Basketballspielen ist im breiten Format, weil es eine Spalte für die Körbe gibt, die von jedem der Teilnehmer gemacht werden:
Spielstätte Oma Geraldine Gertrude 1 1. Brügge 12 5 11 2 2. Gent 4 4 5 3 3. Gent 5 2 6 4 4. Brügge 6 4 7
Schauen Sie sich im Gegensatz dazu die lange Format der exakt gleichen Daten:
Spielort Wert variabel 1 1. Brügge Granny 12 2 2. Gent Granny 4 3 3. Gent Granny 5 4 4th Bruges Granny 6 5 1. Brügge Geraldine 5 6 2. Gent Geraldine 4 7 3. Gent Geraldine 2 8 4. Brügge Geraldine 4 9 1. Brügge Gertrude 11 10 2. Gent Gertrude 5 11 3. Gent Gertrude 6 12 4. Brügge Gertrude 7
Beachten Sie, wie im Langformat die drei Spalten für Granny, Geraldine und Gertrude verschwunden sind. An ihrer Stelle haben Sie jetzt eine Spalte namens value, die die tatsächliche Punktzahl enthält, und eine Spalte namens Variable, die die Partitur mit einer der drei Damen verknüpft.
Bei der Konvertierung von Daten zwischen langen und breiten Formaten ist es wichtig, dass Identifikatorvariablen von gemessenen Variablen unterschieden werden können:
-
Identifikatorvariablen: Identifikator- oder ID-Variablen identifizieren die Beobachtungen. Betrachten Sie diese als den Schlüssel, der Ihre Beobachtungen identifiziert. (Im Datenbankentwurf werden diese als Primär- oder Sekundärschlüssel bezeichnet.)
-
Messgrößen: Dies steht für die Messungen, die Sie beobachtet haben.
In unserem Beispiel sind die Bezeichnervariablen Game und Venue, während die gemessenen Variablen die Ziele sind (das sind die Spalten Granny, Geraldine und Gertrude).