PSPP Cochrans Q-Test und deskriptiven Statistiken mit Häufigkeit auf dem Raspberry Pi 4 (Teil 4)

Der Cochrans Q-Test ist ein statistischer Test, der in der deskriptiven Statistik und in der medizinischen Forschung verwendet wird, um festzustellen, ob es signifikante Unterschiede zwischen mehr als zwei abhängigen Gruppen oder Bedingungen gibt. Dieser Test wird oft in Verbindung mit wiederholten Messungen oder wiederholten Stichproben (auch als within-subjects oder repeated measures bezeichnet) angewendet, bei denen dieselben Personen oder Elemente in verschiedenen Gruppen oder zu verschiedenen Zeitpunkten gemessen werden.

pspp

Der Cochrans Q-Test ist ein nichtparametrischer Test und basiert auf der Anzahl der Abweichungen in den verschiedenen Gruppen. Im Wesentlichen vergleicht der Test die Unterschiede zwischen den Gruppen mit den erwarteten Unterschieden, die zufällig auftreten würden. Wenn die beobachteten Unterschiede zwischen den Gruppen signifikant größer sind als die zufällig erwarteten Unterschiede, weist dies auf signifikante Unterschiede zwischen den Gruppen hin.

Die Hypothesen, die mit dem Cochrans Q-Test getestet werden, sind normalerweise wie folgt:

– Nullhypothese (H0): Es gibt keine signifikanten Unterschiede zwischen den Gruppen.

– Alternativhypothese (H1): Es gibt signifikante Unterschiede zwischen den Gruppen.

Der Cochrans Q-Test ist besonders nützlich, wenn Sie über mehrere Kategorien oder Messzeitpunkte verfügen und überprüfen möchten, ob es signifikante Unterschiede zwischen ihnen gibt. Wenn der Cochrans Q-Test signifikant ist, weist dies darauf hin, dass zumindest eine der Gruppen signifikant von den anderen abweicht. In einem solchen Fall können post hoc-Tests oder weitere Analysen durchgeführt werden, um festzustellen, welche Gruppen voneinander abweichen.

Beim Cochrans Q-Test ist die Testvariable binär skaliert, z.B. Krankheit: Krank = 1 und Nicht Krank = 0 und es gibt mindestens 3 Zeitpunkte (z.B. t1,t2,t3)

So nun zu einem Beispiel mit PSPP.

Der Cochrans Q-Test in PSPP testet verbundene Stichproben (selbe Probanden zu verschiedenen Zeitpunkten) hinsichtlich eines binären Merkmals und ob sich jenes geändert hat. Beispielsweise wurde bei Menschen eine Krankheit diagnostiziert (t1). Nach einer ersten Behandlung werden sie erneut speziell auf diese Krankheit untersucht und entweder ist die Krankheit immer noch vorhanden oder eben nicht mehr (t2). Eine erneute Behandlung muss nicht erfolgen, es wird aber ein zweites Mal gemessen, da gewisse Behandlungen bei manchen Menschen erst später anschlagen können (t3). Hierfür ist der Cochran’s Q-Test auf Basis eines Chi 2-Testes entwickelt worden. Er zeigt, ob die Behandlung(en) einen statistisch signifikanten Effekt erzielt hat und prüft dies bei mindestens zwei Messwiederholungen.

Wir legen diese 4 Numerischen Variablen an.
Die 1. ist die ID oder der Patient. t1,t2,t3 sind die Zeitpunkte vor der Behandlung (t1), nach der ersten Behandlung (t2) und nach der zweiten Behandlung (t3). Alle drei bekommen als Wertelabels den Wert 0 = Nicht Krank und 1 = Krank und als Messniveau: Nominal

pspp

pspp

Jetzt geben wir mal 70 Test-Datensätze ein. Z.B.

Hier die Ansicht binär Kodiert:

Und als Text:

So, jetzt rechnen wir erst einmal die Häufigkeit aus, über das Menü: Analysieren – Deskriptive Statistiken – Häufigkeit.

In dem Dialog wählen wir die t1,t2 und t3 aus und klicken auf OK.

Wir erhalten dieses Ergebnis:

und wenn wir im vorherigen Dialog auch Diagramme ausgewählt haben

Wir können auch die descriptive Häufigkeit über das Menü: Analysieren – Descriptive Statistiken – Descriptive Statistiken einen schönen Zusammenfassung berechnen:

Jetzt kommen wir zu dem eigentlichen gewünschten Cochrans Q-Test.
Wir wählen im Menü: Analysieren – Nichtparametrische Tests – K verbundene Stichproben… aus

In den Dialog wählen wir die drei Testvariablen und das ist wichtig, die rechte Checkbox: Cochran-Q aus. Dann auf OK:

Das Ergebnis des Cochran-Q

Wir können also sehen, das die Erfolge unserer Test-Daten von 47 vor der Behandlung, besser wird auf 23 nach der ersten Behandlung und nach der zweiten Behandlung sogar auf 15. Der Cochrans Q-Test ist schon hoch mit 50,42 und damit kann die Nullhypothese verworfen werden.

Die Asymptotische Signifikanz (Asymp. Sig) wird oft in statistischen Ausgaben und Berichten angegeben und zeigt das Signifikanzniveau (p-Wert) an, das auf den asymptotischen Annahmen basiert. Ein typisches Signifikanzniveau ist beispielsweise 0,05, was bedeutet, dass, wenn „Asymp. Sig“ kleiner als 0,05 ist, die Ergebnisse als statistisch signifikant angesehen werden. Dies impliziert, dass die Wahrscheinlichkeit, dass die beobachteten Unterschiede oder Effekte auf reiner Zufall beruhen, gering ist, und daher die Nullhypothese abgelehnt werden kann.

Die Asymp. Sig. ist bei .000 und damit liegen wir unter .05 sogar unter 0.01 sind damit sehr Signifikant.
Behandlungen haben also aufgrund der Stichproben Signifikanz und sind nicht reiner Zufall.

Das Ergebnis wollen wir nun mit einem Online Rechner validieren.
Die 70 Datensätze von oben mit Semikolon formatiert:

auf der Seite eingeben und den Cochrans Q-Test in der Combobox auswählen. Dann auf den Start Button clicken. Wir kommen auf eine Seite, wo alle drei Spalten mit den Werten angezeigt werden. Dann klicken wir auf „Calculate χ²-score and P-value“ Button. Wir erhalten dieses Ergebnis:

Wir haben nun das gleiche Ergebns 50.42. Super. Das Ergebnis ist mit kleiner .05 sehr Signifikant.