PSPP (Teil 9) Zufallsstichprobe

Stichproben in der Statistik sind ein wesentliches Werkzeug, um Informationen über eine größere Population zu gewinnen, indem man nur einen Teil dieser Population untersucht.

Eine Zufallsstichprobe ist eine Auswahl von Elementen aus einer Gesamtpopulation, bei der jedes Element in der Population eine gleichberechtigte Chance hat, in die Stichprobe aufgenommen zu werden. Das bedeutet, dass jedes Element unabhängig und zufällig ausgewählt wird, ohne dass bestimmte Merkmale oder Eigenschaften bevorzugt werden.

Zufallsstichprobe können auch mit PSPP gezogen werden. Hier ist eine Anleitung dazu:

1. Verstehen des Ziels:
Kläre zuerst, was du über die Population erfahren möchtest. Möchtest du eine Vermutung über die gesamte Gruppe aufstellen oder möchtest du einfach nur einige Eigenschaften verstehen?

2. Auswahl der Stichprobe:
Wähle eine repräsentative Stichprobe aus der Population aus. Repräsentativität ist entscheidend, um sicherzustellen, dass die Stichprobe die Vielfalt und Charakteristiken der Gesamtpopulation widerspiegelt.

3. Festlegen der Größe der Stichprobe:
Die Größe der Stichprobe sollte groß genug sein, um aussagekräftige Schlüsse zu ziehen, aber auch klein genug, um Ressourcen zu schonen. Die richtige Größe hängt von verschiedenen Faktoren ab, wie der Variabilität der Population und dem gewünschten Vertrauensniveau.

4. Zufällige Auswahl:
Stichproben sollten zufällig ausgewählt werden, um Verzerrungen zu vermeiden. Es gibt verschiedene Methoden, um eine zufällige Stichprobe zu ziehen, wie die einfache Zufallsauswahl oder stratifizierte Stichprobenziehung.

5. Daten sammeln:
Sammle die relevanten Daten von der ausgewählten Stichprobe. Achte darauf, dass die Daten korrekt erfasst und repräsentativ für die Gesamtpopulation sind.

6. Analyse der Stichprobe:
Analysiere die gesammelten Daten, um Schlussfolgerungen über die gesamte Population zu ziehen. Hierbei werden statistische Methoden angewendet, um Schätzungen, Konfidenzintervalle und Hypothesentests durchzuführen.

7. Schlussfolgerungen ziehen:
Basierend auf den Ergebnissen der Stichprobe ziehe Schlussfolgerungen über die Gesamtpopulation. Es ist wichtig, Unsicherheiten und potenzielle Grenzen der Stichprobe bei der Interpretation der Ergebnisse zu berücksichtigen.

8. Kommunikation der Ergebnisse:
Präsentiere deine Ergebnisse klar und verständlich. Erkläre, wie die Stichprobe ausgewählt wurde, welche Methoden angewendet wurden und welche Schlussfolgerungen daraus gezogen wurden.

Stichproben sind äußerst nützlich, um Kosten zu reduzieren, Zeit zu sparen und dennoch aussagekräftige Informationen über eine größere Population zu erhalten.

Wie geht das nun mit PSPP?

Über das Menü: Daten – Fälle auswählen

Es öffnet sich dieser Dialog. Wir stellen dort mal ein, das wir ca. 50% als zufällige Stichprobe haben wollen. Wir nehmen wieder die Daten der Flughöhe und dort wählen wir die Anzahl aus:

Als Ergebnis bekommen wir ca. 50% ausgewählt, erkennbar an der 1. Spalte, wo die hälft durchgestrichen (gefiltert) ist.
Auch bekommen wir eine neu Variable filter nach der wir mit rechtsklick sortieren können. Alle ausgewählten bekommen eine 1.00 und alle gefilterten eine .00.

Wir können auch diese Syntax verwenden:

Wollen wir den Filter wieder löschen und eine neue Stichprobe ziehen, geht das mit:

Es gibt weitere Methoden, um eine Zufallsstichprobe zu ziehen:

Einfache Zufallsstichprobe
: Hierbei werden Elemente aus der Gesamtpopulation zufällig ausgewählt. Jedes Element hat die gleiche Wahrscheinlichkeit, in die Stichprobe aufgenommen zu werden, ohne Rücksicht auf andere Merkmale, wie hier im Beispiel

Systematische Zufallsstichprobe: Bei dieser Methode wird ein festgelegtes System verwendet, um Stichproben aus der Population auszuwählen. Zum Beispiel könnte man jedes k-te Element auswählen, wobei k ein bestimmter Schritt ist, der angibt, wie oft man springt, um Elemente auszuwählen.

Stratifizierte Zufallsstichprobe: Hierbei wird die Gesamtpopulation in verschiedene Gruppen oder Strata unterteilt, basierend auf bestimmten Merkmalen, und dann wird aus jeder dieser Gruppen eine Zufallsstichprobe gezogen. Das Ziel ist es, sicherzustellen, dass jede Gruppe angemessen vertreten ist.

Cluster-Zufallsstichprobe: Die Gesamtpopulation wird in Gruppen oder Cluster aufgeteilt, und dann werden einige dieser Cluster zufällig ausgewählt, um als Stichprobe zu dienen. Innerhalb der ausgewählten Cluster werden alle Elemente einbezogen.

Eine Zufallsstichprobe ist wichtig, um Verzerrungen in den Daten zu vermeiden und sicherzustellen, dass die Stichprobe repräsentativ für die Gesamtpopulation ist. Sie ermöglicht es, statistische Schlussfolgerungen über die Gesamtpopulation zu ziehen, wenn sie richtig durchgeführt wird.

Wer bessere kryptographisch sichere Zufallszahlen als die internen von PSPP braucht, kann sich ja über random.org bessere generieren lassen oder das Tool rng-tools verwenden und dann die jeweiligen Zeilen auswählen. Normalerweise müssten die Zufallswerte von PSPP aber reichen.