„Was bedeutet der P-Wert?“ Neuauflage
Kurz und vorheriger Artikelhaben wir eine didaktische Definition des p-Werts bereitgestellt. Allerdings spiegelt es möglicherweise nicht seine volle Bedeutung wider.
Diese Vereinfachung kommt denjenigen zugute, die sich zunächst mit dem Konzept befassen, und trägt zum Aufbau eines grundlegenden Verständnisses bei.
Wir präsentieren nun eine genauere Definition des p-Werts, die genauere Aufmerksamkeit erfordert.
Statistische Hypothesen
Bei der Durchführung eines inferentiellen Hypothesentests – wie etwa Chi-Quadrat, T-Test, ANOVA, Korrelation, Regression usw. – wir haben zwei Hypothesen:
NULLHYPOTHESE (H0): Dies ist die einfachere Standardhypothese. Es geht davon aus, dass es keinen „Unterschied zwischen den Gruppen“ oder keine „Beziehung zwischen den Variablen“ gibt.
ALTERNATIVE HYPOTHESE (H1): Diese Hypothese ist das Komplement von H0. Es suggeriert „Unterschiede zwischen Gruppen“ oder eine „Beziehung zwischen den Variablen“.
Signifikanzniveau und P-Wert
Das Hauptziel jedes Hypothesentests besteht darin, zu bestimmen, ob die Nullhypothese (H0) abgelehnt werden soll oder nicht. Diese Entscheidung hängt von zwei Schlüsselfaktoren ab:
SIGNIFIKANZNIVEAU (α): Dies ist ein vorgegebener Schwellenwert, anhand dessen wir entscheiden, ob wir H0 ablehnen oder nicht. Normalerweise wird er vor der Durchführung des Tests auf 1 % oder 5 % eingestellt.
P-WERT (p): Der p-Wert ist eine Wahrscheinlichkeit, die aus jedem von uns durchgeführten Inferenzhypothesetest ermittelt wird.
Was bedeutet es, statistisch signifikant zu sein?
Nachdem wir unsere Analyse durchgeführt und den p-Wert erhalten haben, vergleichen wir ihn mit unserem voreingestellten Signifikanzniveau (α).
Beispielsweise legen wir ein Signifikanzniveau (α) von 0.05 (oder 5 %) fest. Beim Vergleich dieses α mit unserem erhaltenen p-Wert haben wir zwei Möglichkeiten:
1. Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau α ist (p ≤ 0.05), lehnen wir die Nullhypothese (H0) ab. In diesem Szenario gilt unser Test als statistisch signifikant.
2. Wenn der p-Wert größer als das Signifikanzniveau α ist (p > 0.05), lehnen wir die Nullhypothese (H0) nicht ab. Hier gilt unser Test als nicht statistisch signifikant.
Die Bedeutung des P-Werts
Technisch gesehen ist die p-Wert ist:
die Wahrscheinlichkeit, ein Ergebnis zu erhalten, das dem entspricht, was wir in unseren Daten beobachtet haben (oder extremer ist als dieses), vorausgesetzt, die Nullhypothese ist wahr.
Wenn wir beispielsweise einen p-Wert von 2 % (p = 0.02) erhalten, bedeutet dies, dass, wenn H0 wahr ist, die Wahrscheinlichkeit, Ergebnisse zu erhalten, die unserem (oder extremeren) entsprechen, nur 2 % beträgt. Da dieser kleiner als α = 5 % ist, lehnen wir H0 ab.
Beispiel: Die Dame verkostet Tee
Diese Geschichte führt uns an einen Sommernachmittag in Harpenden, England, in den frühen 1920er Jahren.
Eine Gruppe von Wissenschaftlern – ein Statistiker, ein Algologe und ein Biochemiker – hatte sich zum Nachmittagstee in der Rothamsted Experimental Station versammelt.
Muriel Bristol, die Algologin, bestand darauf, dass über Milch gegossener Tee anders schmeckte als über Tee gegossene Milch.
Die Gruppe stellte ihre Behauptung in Frage und konnte kaum glauben, dass es einen spürbaren Geschmacksunterschied geben könnte.
Ronald Fisher, der Statistiker, schlug ein Experiment vor. Muriel würden acht Tassen Tee serviert werden. Bei der Hälfte davon wurde Milch über den Tee gegossen, bei der anderen Hälfte wurde Tee über die Milch gegossen. Allerdings wollte sie den Vorbereitungsprozess nicht miterleben.
Als sie jede Tasse probierte, identifizierte Muriel die Zubereitungsmethode richtig und machte alle acht richtig!
Abschließende Bemerkungen
Bezüglich unserer Diskussion über den p-Wert.
Betrachten wir die Nullhypothese (H0), dass Muriel die verschiedenen Präparate nicht identifizieren kann. Wenn H0 wahr ist, beträgt die Wahrscheinlichkeit, dass Muriel die Teezubereitung in allen acht Tassen richtig identifizieren konnte, nur 1.43 %.
Da dieser p-Wert von 1.43 % unter unserem gewählten Signifikanzniveau (α) von 5 % liegt, betrachten wir den Test als statistisch signifikant. Daher würden wir die Nullhypothese (H0) ablehnen und stattdessen die Alternativhypothese (H1) unterstützen, dass Muriel zwischen den verschiedenen Teezubereitungen unterscheiden kann.
*Dieses Beispiel veranschaulicht, wie wichtig es ist, vor der Durchführung des Tests das Signifikanzniveau (α) festzulegen. Typischerweise wird α entweder auf 1 % oder 5 % eingestellt. Wenn wir einen p-Wert zwischen diesen beiden Schwellenwerten erhalten würden, wären wir möglicherweise geneigt, den α zu wählen, der unser Ergebnis signifikant erscheinen lässt – in diesem Fall 5 %.
Denken Sie daran, den ersten Artikel zum p-Wert zu lesen! Klick hier!