Dieser Artikel führt Sie durch die Berechnung der Stichprobengröße für a Einfache binäre logistische Regression.
Wir werden die beliebte und frei verfügbare Software verwenden G*Power, das für diesen Zweck am häufigsten verwendet wird.
Wir waren inspirierte Ich habe diesen Artikel erstellt, nachdem ich festgestellt habe, dass viele Online-Tutorials für G*Power-basierte Stichprobengrößenberechnungen ungenau sind.
Nach dem Herunterladen und Installieren von G*Power öffnen Sie es und wählen Sie die Option zur Berechnung der Stichprobengröße für logistische Regression Analyse durch Klicken auf Tests: Korrelation und Regression: Registerkarte „Logistische Regression“.
Geben Sie als Nächstes Folgendes ein Parameter:
In Schwanz(e)Wählen Eins für einseitige Tests oder Zwei für zweiseitige Tests.
A einschwänzig Der Test eignet sich für eine bestimmte Alternativhypothese, z. B. „Ein erhöhter Wert von X entspricht einer höheren Wahrscheinlichkeit für das Eintreten des Ereignisses."
A zweischwänzig Der Test eignet sich für eine allgemeine Alternativhypothese, wie „X beeinflusst Ereignis Y,” ohne eine anfängliche Richtungsunterscheidung.
Basieren Sie Ihre Hypothese auf dem vorhandenen Wissen in Ihrem Fachgebiet. Wenn Sie unsicher sind, entscheiden Sie sich für Zwei (zweischwänzig).
Das Signifikanzniveau (α) stellt die Wahrscheinlichkeit dar, die Nullhypothese abzulehnen, wenn sie wahr ist, was zu einem Fehler vom Typ I führt.
Typischerweise wird α auf eingestellt 0.05 or 0.01. Ein α von 0.05 weist beispielsweise darauf hin, dass ein Risiko von 5 % für den Schluss besteht, dass eine signifikante Beziehung besteht, wenn dies tatsächlich nicht der Fall ist.
Die Teststärke (1 – β) ist die Wahrscheinlichkeit, die Nullhypothese abzulehnen, wenn sie falsch ist, wodurch effektiv der Fehler vom Typ II (β) kontrolliert wird.
Akzeptable Werte liegen normalerweise zwischen 0.80 zu 0.99. Eine höhere Testleistung ist vorzuziehen, erhöht aber auch die erforderliche Stichprobengröße.
Da einfache binäre logistische Regressionsmodelle nur eine unabhängige Variable haben, legen Sie diesen Wert auf fest Null.
Wähle aus Verteilungstyp für Variable X, die unabhängige Variable oder Prädiktorvariable im Modell.
Wählen Binomial für binäre Variablen, Normal für kontinuierliche quantitative Variablen und Fisch für diskrete Variablen. Verwenden Sie andere verfügbare Distributionen nur bei Bedarf.
Die letzten vier Parameter erfordern Bevölkerungsschätzungen aus einer Pilotstudie, ähnlichen Untersuchungen oder theoretischen Berechnungen.
Wenn möglich, verwenden Sie Daten von a Pilotstudie, wie wir hier zeigen werden.
Geben Sie den Mittelwert und die Standardabweichung der Variablen X von den Pilotstudiendaten für ein Bevölkerungsmittelwert der Variablen X und Bevölkerungsstandardabweichung von variablen X-Parametern.
Erhalten Sie die letzten beiden Parameter durch a vorläufig einfache logistische Regressionsanalyse mit den Daten der Pilotstudie.
Für unsere Demonstration verwenden wir das kostenlose und benutzerfreundliche PSPP Software. Beliebig Software. Es können Daten verwendet werden, die eine logistische Regression ausführen können.
Die Wahrscheinlichkeit gibt den Zusammenhang zwischen einer Exposition und einem Ergebnis an und misst die Effektgröße.
Führen Sie eine Voruntersuchung mit den Pilotdaten im PSPP, um die Wahrscheinlichkeit -Wert (Exp(B) für die Variable X, in diesem Beispiel 1.48) und geben Sie ihn in G*Power ein.
Der letzte Parameter ist die Wahrscheinlichkeit des Auftretens der abhängigen Variablen (y = 1), wenn die Nullhypothese (H0) wahr ist, dh wenn der Koeffizient der unabhängigen Variablen (X) gleich 0 ist und das Modell nur den Achsenabschnitt enthält.
Um diesen Wert zu berechnen, geben Sie ein Konstante (Achsenabschnitt) Schätzung B aus dem vorherigen Schritt in die folgende Excel-Formel:
=EXP(B)/(1+EXP(B))
Für unser Beispiel:
=EXP(-1.85)/(1+EXP(-1.85))
= 0.1355
Wenn alle Parameter in G*Power eingegeben sind, klicken Sie auf Berechnen um die durch die Berechnung ermittelte Stichprobengröße zu erhalten!
In unserer BeispielDie zur Ermittlung des geschätzten Quotenverhältnisses erforderliche Stichprobengröße beträgt 97 Personen, die zufällig aus der Zielpopulation ausgewählt werden.
Indem du diese befolgst Schritte Und mit G*Power können Sie effektiv die geeignete Stichprobengröße für eine einfache binäre logistische Regressionsanalyse berechnen.
Dieses Prozessdefinierung ermöglicht es Ihnen, Ihr Studiendesign zu optimieren, Fehler zu minimieren und die Validität Ihrer Ergebnisse zu verbessern.
Außerdem sind, Verständnis Die Rolle verschiedener Parameter bei der Bestimmung der Stichprobengröße trägt zu einem umfassenden Verständnis der logistischen Regression als Ganzes bei.
Möchten Sie erfahren, wie Sie die Stichprobengröße in G*Power für die wichtigsten Inferenzanalysen berechnen?
Verpassen Sie nicht die KOSTENLOS Beispiele unseres kürzlich veröffentlichten digitalen Buches!
Im Inneren beherrschen Sie die Berechnung der Stichprobengröße für unabhängige oder gepaarte t-Tests. ein- oder zweifaktorielle ANOVA, mit oder ohne wiederholte Messungen und gemischte Modelle; einfache und multiple lineare und logistische Regression und mehr.
Klicken Sie auf diesen Link und entdecken Sie alles, was es zu bieten hat: Angewandte Statistik: Datenanalyse.
Meistern Sie die Kaplan-Meier-Überlebensanalyse in R und entdecken Sie die Geheimnisse der Time-to-Event-Datenanalyse, um fundierte Entscheidungen zu ermöglichen.
Entdecken Sie die Essenz der RM-ANOVA in unserem umfassenden Leitfaden und beherrschen Sie die Variabilitätsanalyse innerhalb des Subjekts für aussagekräftige Forschungserkenntnisse.
Nutzen Sie das Potenzial des Kruskal-Wallis-Tests für die präzise und klare Analyse nichtparametrischer Daten über mehrere Gruppen hinweg.
Was ist in der Wissenschaft eine abhängige Variable? Lernen Sie, sie von unabhängigen Variablen zu unterscheiden und reale Anwendungen zu entdecken.
Erfahren Sie, wie Sie Cohens d ermitteln, ein wichtiges statistisches Maß zur Quantifizierung der Standarddifferenz zwischen zwei Mittelwerten in der Datenanalyse.
Statistiken und gefälschte Nachrichten: Verstehen Sie, warum die [falsche] Verwendung von Statistiken die Akzeptanz gefälschter Nachrichten als Wahrheit erheblich beeinträchtigen kann.