Stichprobengröße in der logistischen Regression
|

Stichprobengröße in der logistischen Regression: Ein einfacher binärer Ansatz

Dieser Artikel führt Sie durch die Berechnung der Stichprobengröße für a Einfache binäre logistische Regression.

Wir werden die beliebte und frei verfügbare Software verwenden G*Power, das für diesen Zweck am häufigsten verwendet wird.

Wir waren inspirierte Ich habe diesen Artikel erstellt, nachdem ich festgestellt habe, dass viele Online-Tutorials für G*Power-basierte Stichprobengrößenberechnungen ungenau sind.

Auswahl der logistischen Regressionsanalyse

Nach dem Herunterladen und Installieren von G*Power öffnen Sie es und wählen Sie die Option zur Berechnung der Stichprobengröße für logistische Regression Analyse durch Klicken auf Tests: Korrelation und Regression: Registerkarte „Logistische Regression“.

Einschwänzig oder zweischwänzig?

Geben Sie als Nächstes Folgendes ein Parameter:

In Schwanz(e)Wählen Eins für einseitige Tests oder Zwei für zweiseitige Tests.

A einschwänzig Der Test eignet sich für eine bestimmte Alternativhypothese, z. B. „Ein erhöhter Wert von X entspricht einer höheren Wahrscheinlichkeit für das Eintreten des Ereignisses."

A zweischwänzig Der Test eignet sich für eine allgemeine Alternativhypothese, wie „X beeinflusst Ereignis Y,” ohne eine anfängliche Richtungsunterscheidung.

Basieren Sie Ihre Hypothese auf dem vorhandenen Wissen in Ihrem Fachgebiet. Wenn Sie unsicher sind, entscheiden Sie sich für Zwei (zweischwänzig).

Signifikanzniveau

Das Signifikanzniveau (α) stellt die Wahrscheinlichkeit dar, die Nullhypothese abzulehnen, wenn sie wahr ist, was zu einem Fehler vom Typ I führt.

Typischerweise wird α auf eingestellt 0.05 or 0.01. Ein α von 0.05 weist beispielsweise darauf hin, dass ein Risiko von 5 % für den Schluss besteht, dass eine signifikante Beziehung besteht, wenn dies tatsächlich nicht der Fall ist.

Statistische Macht

Die Teststärke (1 – β) ist die Wahrscheinlichkeit, die Nullhypothese abzulehnen, wenn sie falsch ist, wodurch effektiv der Fehler vom Typ II (β) kontrolliert wird.

Akzeptable Werte liegen normalerweise zwischen 0.80 zu 0.99. Eine höhere Testleistung ist vorzuziehen, erhöht aber auch die erforderliche Stichprobengröße.

R² anderer erklärender Variablen (X)

Da einfache binäre logistische Regressionsmodelle nur eine unabhängige Variable haben, legen Sie diesen Wert auf fest Null.

❓ VERWIRRT DURCH DATENANALYSE?

Unser umfassender Leitfaden macht es kristallklar
Klicke, um mehr zu lernen!

Variable X-Verteilung

Wähle aus Verteilungstyp für Variable X, die unabhängige Variable oder Prädiktorvariable im Modell.

Wählen Binomial für binäre Variablen, Normal für kontinuierliche quantitative Variablen und Fisch für diskrete Variablen. Verwenden Sie andere verfügbare Distributionen nur bei Bedarf.

Pilotstudie?

Die letzten vier Parameter erfordern Bevölkerungsschätzungen aus einer Pilotstudie, ähnlichen Untersuchungen oder theoretischen Berechnungen.

Wenn möglich, verwenden Sie Daten von a Pilotstudie, wie wir hier zeigen werden.

Geschätzter Mittelwert und Standardabweichung

Geben Sie den Mittelwert und die Standardabweichung der Variablen X von den Pilotstudiendaten für ein Bevölkerungsmittelwert der Variablen X und Bevölkerungsstandardabweichung von variablen X-Parametern.

Voruntersuchung

Erhalten Sie die letzten beiden Parameter durch a vorläufig einfache logistische Regressionsanalyse mit den Daten der Pilotstudie.

Für unsere Demonstration verwenden wir das kostenlose und benutzerfreundliche PSPP Software. Beliebig Software. Es können Daten verwendet werden, die eine logistische Regression ausführen können.

Erfahren Sie hier, wie Sie PSPP verwenden!

Wahrscheinlichkeit

Die Wahrscheinlichkeit gibt den Zusammenhang zwischen einer Exposition und einem Ergebnis an und misst die Effektgröße.

Führen Sie eine Voruntersuchung mit den Pilotdaten im PSPP, um die Wahrscheinlichkeit -Wert (Exp(B) für die Variable X, in diesem Beispiel 1.48) und geben Sie ihn in G*Power ein.

Wahrscheinlichkeit von y = 1 unter H0

Der letzte Parameter ist die Wahrscheinlichkeit des Auftretens der abhängigen Variablen (y = 1), wenn die Nullhypothese (H0) wahr ist, dh wenn der Koeffizient der unabhängigen Variablen (X) gleich 0 ist und das Modell nur den Achsenabschnitt enthält.

Um diesen Wert zu berechnen, geben Sie ein Konstante (Achsenabschnitt) Schätzung B aus dem vorherigen Schritt in die folgende Excel-Formel:

=EXP(B)/(1+EXP(B))

Für unser Beispiel:

=EXP(-1.85)/(1+EXP(-1.85))

= 0.1355

Schlussfolgerung

Wenn alle Parameter in G*Power eingegeben sind, klicken Sie auf Berechnen um die durch die Berechnung ermittelte Stichprobengröße zu erhalten!

In unserer BeispielDie zur Ermittlung des geschätzten Quotenverhältnisses erforderliche Stichprobengröße beträgt 97 Personen, die zufällig aus der Zielpopulation ausgewählt werden.

Indem du diese befolgst Schritte Und mit G*Power können Sie effektiv die geeignete Stichprobengröße für eine einfache binäre logistische Regressionsanalyse berechnen.

Dieses Prozessdefinierung ermöglicht es Ihnen, Ihr Studiendesign zu optimieren, Fehler zu minimieren und die Validität Ihrer Ergebnisse zu verbessern.

Außerdem sind, Verständnis Die Rolle verschiedener Parameter bei der Bestimmung der Stichprobengröße trägt zu einem umfassenden Verständnis der logistischen Regression als Ganzes bei.

Möchten Sie erfahren, wie Sie die Stichprobengröße in G*Power für die wichtigsten Inferenzanalysen berechnen?

Verpassen Sie nicht die KOSTENLOS Beispiele unseres kürzlich veröffentlichten digitalen Buches!

Im Inneren beherrschen Sie die Berechnung der Stichprobengröße für unabhängige oder gepaarte t-Tests. ein- oder zweifaktorielle ANOVA, mit oder ohne wiederholte Messungen und gemischte Modelle; einfache und multiple lineare und logistische Regression und mehr.

Klicken Sie auf diesen Link und entdecken Sie alles, was es zu bieten hat: Angewandte Statistik: Datenanalyse.

Besuchen Sie uns in unseren sozialen Netzwerken

TÄGLICHE BEITRÄGE AUF INSTAGRAM!

Ähnliche Beiträge

Hinterlassen Sie uns einen Kommentar

E-Mail-Adresse wird nicht veröffentlicht. Pflichtfelder sind MIT * gekennzeichnet. *