Video: How to Build a Human 2025
Um die statistische Analyse mit Excel zu verstehen, hilft es, den zentralen Grenzwertsatz zu simulieren. Es klingt fast nicht richtig. Wie kann eine Population, die nicht normalverteilt ist, zu einer normal verteilten Stichprobenverteilung führen?
Um Ihnen eine Vorstellung davon zu vermitteln, wie der zentrale Grenzwertsatz funktioniert, gibt es eine Simulation. Diese Simulation erzeugt so etwas wie eine Stichprobenverteilung des Mittelwerts für eine sehr kleine Stichprobe, basierend auf einer Population, die nicht normalverteilt ist. Wie Sie sehen werden, obwohl die Population keine Normalverteilung ist, und obwohl die Stichprobe klein ist, sieht die Stichprobenverteilung des Mittelwerts ziemlich wie eine normale Verteilung aus.
Stellen Sie sich eine riesige Population vor, die aus nur drei Scores besteht - 1, 2 und 3 - und jede ist mit gleicher Wahrscheinlichkeit in einer Stichprobe zu finden. Stellen Sie sich auch vor, dass Sie zufällig eine Stichprobe von drei Scores aus dieser Population auswählen können.
Stichprobe | Mittelwert | Stichprobe | Mittelwert | Stichprobe | Mittelwert |
1, 1, 1 | 1. 00 | 2, 1, 1 | 1. 33 999, 3, 1, 1 999, 1. 67 | 1, 1, 2 1. 33 999, 2, 1, 2, 999, 1. 67 | 3, 1, 2 2. 00 |
1, 1, 3 | 1. 67 | 2, 1, 3 | 2. 00 | 3, 1, 3 | 2. 33 999, 1, 2, 1, 999, 1. 33 999, 2, 2, 1 999, 1. 67 |
3, 2, 1 | 2. 00 | 1, 2, 2 | 1. 67 | 2, 2, 2 | 2. 00 |
3, 2, 2 | 2. 33 999, 1, 2, 3, 999, 2. 00 | 2, 2, 3 | 2. 33 999 3, 2, 3 999 2. 67 | 1, 3, 1 1. 67 | 2, 3, 1 |
2. 00 | 3, 3, 1 | 2. 33 | 1, 3, 2 2. 00 | 2, 3, 2 | 2. 33 999 3, 3, 2 999 2. 67 |
1, 3, 3 2. 33 | 2, 3, 3 2. 67 | 3, 3, 3 3. 00 |
|
Wenn Sie sich den Tisch genau ansehen, können Sie fast sehen, was in der Simulation passieren wird. Der am häufigsten vorkommende Stichprobenmittelwert ist 2. 00. Die Stichprobe, die am seltensten erscheint, ist 1. 00 und 3. 00. Hmmm … | In der Simulation wurde eine Punktzahl zufällig aus der Grundgesamtheit ausgewählt und dann zufällig zwei ausgewählt. Mehr. Diese Gruppe von drei Bewertungen ist eine Stichprobe. Dann berechnen Sie den Mittelwert dieser Stichprobe. Dieser Vorgang wurde für insgesamt 60 Proben wiederholt, was 60 Probenmittel ergab. Schließlich geben Sie die Verteilung der Stichprobenmittel an. |
|
Wie sieht die simulierte Stichprobenverteilung des Mittelwerts aus? Das folgende Bild zeigt ein Arbeitsblatt, das diese Frage beantwortet. |
|
Im Arbeitsblatt ist jede Zeile ein Beispiel.Die mit x1, x2 und x3 gekennzeichneten Spalten zeigen die drei Bewertungen für jede Probe. Spalte E zeigt den Durchschnitt für die Probe in jeder Zeile. Spalte G zeigt alle möglichen Werte für den Stichprobenmittelwert und Spalte H zeigt, wie oft jeder Mittelwert in den 60 Stichproben erscheint. Die Spalten G und H und der Graph zeigen, dass die Verteilung ihre maximale Frequenz hat, wenn das Abtastmittel 2,00 ist. Die Frequenzen schwächen ab, wenn sich das Abtastmittel immer weiter von 2,00 entfernt. |
|
Der Punkt von all dem ist, dass die Bevölkerung nicht wie eine normale Verteilung aussieht und die Stichprobengröße sehr klein ist. Selbst unter diesen Bedingungen beginnt die Abtastverteilung des Mittelwertes auf der Basis von 60 Abtastwerten sehr einer normalen Verteilung zu ähneln. |
Was ist mit den Parametern, die der zentrale Grenzwertsatz für die Stichprobenverteilung vorhersagt? Beginne mit der Bevölkerung. Der Bevölkerungsdurchschnitt ist 2. 00 und die Standardabweichung der Bevölkerung ist. 67. (Diese Art von Population erfordert etwas ausgefallene Mathematik, um die Parameter herauszufinden.) |
|
Weiter zur Stichprobenverteilung. Der Mittelwert der 60 Mittel ist 1. 98, und ihre Standardabweichung (eine Schätzung des Standardfehlers des Mittelwerts) ist. 48. Diese Zahlen nähern sich den für die Stichprobenverteilung des Mittelwerts, 2.00 (entspricht dem Bevölkerungsdurchschnitt) und. 47 (die Standardabweichung, 67, dividiert durch die Quadratwurzel von 3, die Stichprobengröße). | Falls Sie an dieser Simulation interessiert sind, gehen Sie wie folgt vor: | Wählen Sie eine Zelle für Ihre erste zufällig ausgewählte Nummer aus. | Wählen Sie die Zelle B2 aus. |
Verwenden Sie die Arbeitsblattfunktion | RANDBETWEEN | , um 1, 2 oder 3 auszuwählen. | Dies simuliert das Zeichnen einer Zahl aus einer Population bestehend aus den Zahlen 1, 2 und 3, wobei Sie die gleichen Chancen haben. der Auswahl jeder Nummer. Sie können entweder | FORMEL | Mathe & Trig | RANDBETWEEN | und verwenden Sie das Dialogfeld Funktionsargumente oder geben Sie einfach |
in B2 ein und drücken Sie die Eingabetaste. Das erste Argument ist die kleinste Zahl, die RANDBETWEEN zurückgibt, und das zweite Argument ist die größte Zahl.
Wählen Sie die Zelle rechts neben der ursprünglichen Zelle aus und wählen Sie eine andere Zufallszahl zwischen 1 und 3. Führen Sie dies erneut für eine dritte Zufallszahl in der Zelle rechts neben der zweiten aus.
Der einfachste Weg, dies zu tun, besteht darin, die beiden Zellen rechts von der ursprünglichen Zelle automatisch zu füllen. In diesem Arbeitsblatt sind diese beiden Zellen C2 und D2.Betrachten Sie diese drei Zellen als eine Probe und berechnen Sie ihren Mittelwert in der Zelle rechts von der dritten Zelle.
Am einfachsten tun Sie dies, indem Sie= MITTELWERT (B2: D2)
in Zelle E2 eingeben und die Eingabetaste drücken.Wiederholen Sie diesen Vorgang für so viele Proben, wie Sie in die Simulation einbeziehen möchten. Jede Zeile muss einer Probe entsprechen.
60 Proben wurden hier verwendet. Der schnellste und einfachste Weg, dies zu erreichen, besteht darin, die erste Reihe von drei zufällig ausgewählten Zahlen und ihren Mittelwert auszuwählen und dann die verbleibenden Zeilen automatisch zu füllen. Der Stichprobensatz in Spalte E ist die simulierte Stichprobenverteilung des Mittelwerts.Verwenden Sie
AVERAGEund
STDEV. P
- um seinen Mittelwert und seine Standardabweichung zu finden.
Um zu sehen, wie diese simulierte Sampling-Verteilung aussieht, verwenden Sie die Array-Funktion
- FREQUENCY
auf der Sample-Einrichtung in Spalte E. Folgen Sie diesen Schritten:
Geben Sie die möglichen Werte des Samples in ein Array ein..Sie können dazu die Spalte G verwenden. Sie können die möglichen Werte des Stichprobenmittels in Bruchform (3/3, 4/3, 5/3, 6/3, 7/3, 8/3 und 9/3) wie die in die Zellen eingegebenen Werte ausdrücken. G2 bis G8. Excel konvertiert sie in eine Dezimalform. Vergewissern Sie sich, dass diese Zellen im Zahlenformat vorliegen.
Wählen Sie ein Array für die Häufigkeiten der möglichen Werte des Stichprobenmittelwerts aus.
Sie können die Spalte H verwenden, um die Frequenzen zu halten und die Zellen H2 bis H8 auszuwählen.Wählen Sie im Menü Statistische Funktionen
FREQUENZ - , um das Dialogfeld Funktionsargumente für
FREQUENZ
- zu öffnen. Geben Sie im Dialogfeld Funktionsargumente die entsprechenden Werte für die Argumente ein.
Geben Sie im Feld Data_array die Zellen ein, die das Beispielmittel enthalten. In diesem Beispiel ist das E2: E61.
Identifizieren Sie das Array, das die möglichen Werte des Stichprobenmittelwerts enthält.
FREQUENCY - enthält dieses Array im Feld Bins_array. Für dieses Arbeitsblatt wird G2: G8 in das Feld Bins_array eingefügt. Nachdem Sie beide Arrays identifiziert haben, werden im Dialogfeld Funktionsargumente die Häufigkeiten in geschweiften Klammern angezeigt.
Drücken Sie Strg + Umschalt + Eingabe, um das Dialogfeld Funktionsargumente zu schließen und die Häufigkeiten anzuzeigen.
Verwenden Sie diese Tastenkombination, da
FREQUENCY
eine Array-Funktion ist.
Wenn H2: H8 hervorgehoben ist, wählen Sie
Einfügen | Empfohlene Diagramme
und wählen Sie das Layout der geclusterten Spalten, um den Graphen der Frequenzen zu erstellen. Ihr Diagramm wird wahrscheinlich etwas anders aussehen als meins, weil Sie wahrscheinlich mit einer anderen Zufallszahl auftauchen werden.
Übrigens wiederholt Excel den Zufallsauswahlprozess immer dann, wenn Sie etwas tun, das Excel dazu veranlasst, das Arbeitsblatt neu zu berechnen. Der Effekt ist, dass sich die Zahlen ändern können, während Sie dies durcharbeiten. (Das heißt, Sie führen die Simulation erneut aus.) Wenn Sie z. B. zurückgehen und eine der Zeilen erneut automatisch füllen, ändern sich die Zahlen und das Diagramm ändert sich.
