Konfidenzintervalle

Studienauswertung

Konfidenzintervalle für Punktschätzer

Ein Punktschätzer, wie im Abschnitt zu den deskriptiven Kenngrößen behandelt, bringt immer ein gewisses Risiko mit sich, den tatsächlichen Parameter der Grundgesamtheit nicht genau zu treffen. Deshalb ist es in der Regel sinnvoll, nicht nur den konkreten Wert des Punktschätzers selbst, sondern ein Intervall um den Schätzer herum zu betrachten, das den wahren Parameter mit einer hohen Wahrscheinlichkeit enthält. Solche Intervalle heißen Konfidenzintervalle. Würden wir 100 Mal hintereinander eine Stichprobe aus der Grundgesamtheit ziehen und je ein Konfidenzintervall um den geschätzten Mittelwert dieser Stichprobe bilden, würde in 95 Fällen (bzw. in 95 % der Fälle) der tatsächliche Parameter \mu in dem ermittelten Konfidenzintervall liegen. Vereinfacht, wenn auch mathematisch nicht ganz korrekt, sagen wir im Weiteren, dass das 95 %-Konfidenzintervall für z. B. den Mittelwert \overline{x} den tatsächlichen Mittelwert der Grundgesamtheit \mu mit einer Wahrscheinlichkeit von 95 % überdeckt. Diese Wahrscheinlichkeit wird Grad an gewünschter Sicherheit genannt und durch 1-\alpha bezeichnet. Ihr fragt euch nun bestimmt, was es mit diesem \alpha auf sich hat, oder? Es handelt sich dabei um das Signifikanzniveau \alpha, das im späteren Verlauf des Kapitels nochmal genauer thematisiert wird. In diesem Fall beschreibt \alpha die maximal tolerierte Wahrscheinlichkeit, dass der wahre Parameter nicht vom aufgestellten Konfidenzintervall überdeckt wird. Vorerst genügt es zu verstehen, dass 1-\alpha die Gegenwahrscheinlichkeit zum Signifikanzniveau \alpha ist und bei z. B. \alpha=5\% somit ein 95 %- Konfidenzintervall resultiert.

Konfidenzintervalle für einen Punktschätzer berechnen sich wie folgt:

(1-\alpha)\text{-}{KI}_{wahrer\text{ }Wert} = \left[Schätzer \pm q_{1-\frac{\alpha}{2}} \cdot SE\right]

Das q_{1-\frac{\alpha}{2}} beschreibt damit das (1-\frac{\alpha}{2})Quantil der Standardnormalverteilung, d. h. für \alpha=5\% ist z. B. das 97,5 %- Quantil der Standardnormalverteilung gesucht, was durch q_{1-\frac{\alpha}{2}} \approx 1,96 gegeben ist. Das Signifikanzniveau \alpha wird dabei halbiert, da wir im Rahmen dieser Veranstaltung nur zweiseitige Unterschiedshypothesen betrachten, die einen Unterschied in beide Richtungen untersuchen. Durch SE wird der Standardfehler des Schätzers selbst berücksichtigt, der sich für den Mittelwert z. B. aus der empirischen Standardabweichung und der Wurzel des Stichprobenumfangs SE = \frac{SD(x)}{\sqrt{n}} ergibt (für mehr Informationen dazu, schau dir nochmal den Abschnitt zu den Streuungsschätzern an; Achtung: Für andere Schätzer berechnet sich der Standardfehler durch andere Formeln, auf die hier aber nicht weiter eingegangen werden soll).

Beispiel "Blutdrucksenker"

Wir wollen nun ein 95 %-Konfidenzintervall (\alpha=5\%) für den Mittelwert unserer Körpergrößen aufstellen. Wir haben den Mittelwert der Stichprobe bereits durch \overline{x}=175,8\text{ cm} und den Standardfehler SE=3,94 geschätzt. Damit ergibt sich das folgende Konfidenzintervall

95 \% \text{-}{KI}_\mu = \left[175,8 – 1,96 \cdot 3,94;\text{ }175,8 + 1,96 \cdot 3,94\right] \approx [168,1;\text{ }183,5].

Das heißt, dass das Konfidenzintervall von 168,1 cm bis 183,5 cm den tatsächlichen Mittelwert der Körpergrößen mit einer Wahrscheinlichkeit von 95 % überdeckt.

Konfidenzintervalle für Raten- und Effektschätzer

Konfidenzintervalle können nicht nur wie oben beschrieben für Punktschätzer (oben z. B. den Mittelwert) aufgestellt werden, sondern auch für Raten- und Effektschätzer.

Später werdet ihr sehen, dass Konfidenzintervalle für Effektschätzer auch genutzt werden können, um Testentscheidungen bei statistischen Tests zu treffen.

Für Raten- und Differenzschätzer (z. B. Prävalenzrate, Prävalenzdifferenz, Risikodifferenz, Mittelwertsdifferenz) ergibt sich das Konfidenzintervall nach oben genannter Formel. Zu beachten ist lediglich, dass sich der Standardfehler je nach Schätzer gegebenenfalls unterschiedlich berechnen lässt, für eine Rate p z. B. durch SE = \sqrt{\frac{\widehat{p} \cdot (1-\widehat{p})}{n}} wobei \widehat{p} für die empirische Schätzung der Rate aus den vorliegenden Daten steht.
Die Voraussetzung für die Nutzung der oben genannten Formel für die Aufstellung eines Konfidenzintervalls ist, dass die Schätzer, wenn man sie mehrfach hintereinander schätzen würde, der Normalverteilung folgen.

Bei Verhältnisschätzern, wie dem Prävalenzratio, dem Relativen Risiko, dem Odds Ratio und dem Hazard Ratio, ist diese Voraussetzung nicht gegeben, denn die Schätzer sind schief verteilt. Im Abschnitt zur Normalverteilung haben wir schon gelernt, dass Transformationen hilfreich sein können, um aus einer nicht-normalverteilten Variable eine normalverteilte zu machen. Wir bedienen uns nun dieser Methode und wenden dementsprechend zuerst eine logarithmische Transformation auf den Schätzer an und bilden dann im Anschluss ein Konfidenzintervall um den nun annähernd normalverteilten Schätzer:

(1-\alpha)\text{-}KI_{\ln(wahrer\text{ }Wert]}=\left[\ln⁡(Verhältnisschätzer)\pm q_{(1-\frac{\alpha}{2})}\cdot SE_{\ln⁡(wahrer\text{ }Wert)}\right]

Es handelt sich nun um ein Konfidenzintervall für den natürlichen Logarithmus des betrachteten Verhältnisschätzers. Um das berechnete Konfidenzintervall aber auch inhaltlich für den ursprünglich betrachteten Verhältnisschätzer (also ohne natürlichen Logarithmus) interpretieren zu können, müssen wir die Grenzen des Konfidenzintervalls zurücktransformieren. Vielleicht erinnert ihr euch noch z. B. aus der Schule daran, dass die Umkehrfunktion zum natürlichen Logarithmus die Exponentialfunktion ist. Wir berechnen also

(1-\alpha)\text{-}KI_{wahrer\text{ }Wert}

= \exp⁡\left((1-\alpha)\text{-}KI_{\ln(wahrer\text{ }Wert)}\right)

=\left[\exp⁡(Untergrenze\left((1-\alpha)\text{-}KI_{\ln(wahrer\text{ }Wert)}\right);\text{ }\exp(Obergrenze\left((1-\alpha)\text{-}KI_{\ln(wahrer\text{ }Wert)}\right)\right],

d. h. wir stecken sowohl die Untergrenze als auch die Obergrenze des berechneten Konfidenzintervalls für den logarithmierten Schätzer in die Exponentialfunktion.

Die Breite der ermittelten Konfidenzintervalle sollte auch betrachtet werden: Je schmaler das Konfidenzintervall, desto präziser ist die Schätzung.

Außerdem lohnt sich ein Blick auf die konkreten Werte, die die Konfidenzintervalle enthalten. Bei einem Konfidenzintervall für einen Differenzschätzer ist es von Interesse, ob die 0 im Konfidenzintervall enthalten ist. Wir haben im Abschnitt zu den Effektschätzern gelernt, dass ein Differenzschätzer von 0 dafür steht, dass keine Differenz zwischen den betrachteten Gruppen vorliegt. Handelt es sich um ein Konfidenzintervall für einen Verhältnisschätzer spräche die enthaltene 1 im Konfidenzintervall dafür, dass es keinen Unterschied zwischen den Gruppen gibt. Wir gehen auf diese Thematik im Kapitel statistische Tests noch genauer ein.

Beispiel "Blutdrucksenker"

Wir wollen nun jeweils ein Konfidenzintervall für einen Differenz- und einen Verhältnisschätzer aufstellen. Wie auch im späteren Abschnitt zum Chi-Quadrat-Test betrachten wir die Effektschätzer Risikodifferenz und Relatives Risiko. Die im Abschnitt Effektschätzer ermittelten Schätzwerte betragen \widehat{RD}\approx 0,22 und \widehat{RR}\approx 1,34.

Wir haben eben gelernt, dass ein Konfidenzintervall für Differenzschätzer anhand der oben thematisierten Formel berechnet werden kann:

(1-\alpha)\text{-}{KI}_{wahrer\text{ }Wert} = \left[Differenzschätzer\pm q_{1-\frac{\alpha}{2}} \cdot SE_{wahrer\text{ }Wert}\right].

In unserem Fall wird also das folgende Konfidenzintervall für die Risikodifferenz gesucht:

95\%\text{-}{KI}_{RD} = \left[\widehat{RD} \pm 1,96 \cdot SE_{RD}\right],

wir setzen für \alpha=5\%, den Schätzer \widehat{RD} für den wahren Wert RD und das 97,5 % – Quantil der Standardnormalverteilung q_{0,975}\approx 1,96 in die obige Formel ein. Die Berechnung des Standardfehlers der Risikodifferenz ist für unser EpiBioManual zu kompliziert (wenn du mehr dazu erfahren möchtest, schaue dir die Erklärung auf dieser externen Website an), deshalb geben wir euch einfach das Ergebnis der Berechnung SE_{RD}\approx 0,08 vor.

Damit ergibt sich das Konfidenzintervall

95\%\text{-}KI_{RD}=\left[0,22-1,96\cdot 0,08;\text{ }0,22+1,96\cdot 0,08\right]=[0,06;\text{ }0,38].

Wir sehen, dass das Konfidenzintervall die RD=0 nicht enthält, die dafür sprechen würde, dass keine Differenz zwischen den Risiken der Gruppen vorliegt.

Als nächstes folgt das Konfidenzintervall für das Relative Risiko, also einem Verhältnisschätzer. Die Formel für Konfidenzintervalle für Verhältnisschätzer sieht wie folgt aus:

(1-\alpha)\text{-}KI_{\ln(wahrer\text{ }Wert]}=\left[\ln⁡(Verhältnisschätzer)\pm q_{(1-\frac{\alpha}{2})}\cdot SE_{\ln⁡(wahrer\text{ }Wert)}\right].

Für unseren Fall benötigen wir also

95\%\text{-}KI_{\ln(RR)}=\left[\ln(\widehat{RR})\pm 1,96\cdot SE_{\ln(RR)}\right] bei \alpha=5\%.

Auch hier geben wir euch den Wert für den Standardfehler SE_{\ln(RR)}\approx 0,12 vor (wenn du mehr dazu erfahren möchtest, schaue dir die Erklärung auf dieser externen Website an). Es ergibt sich

95\%\text{-}KI_{\ln(RR)}=\left[\ln(1,34)- 1,96\cdot 0,12;\text{ }\ln(1,34)+ 1,96\cdot 0,12\right]\approx[0,06;\text{ }0,53].

Wir möchten aber gerne das Konfidenzintervall für das Relative Risiko ermitteln und nicht für dessen log-Transformation. Deshalb müssen wir im letzten Schritt noch die Rücktransformation mithilfe der Exponentialfunktion durchführen

95\%\text{-}KI_{RR}\approx\left[\exp(0,06);\text{ }\exp(0,53)\right]\approx[1,06;\text{ }1,70].

Auch hier stellen wir fest, dass das RR = 1, das für ein gleiches Risiko zwischen den Gruppen stünde, nicht im Konfidenzintervall enthalten ist.

Zusatzwissen

Achtung: Ein Konfidenzintervall ist zu unterscheiden von dem sogenannten Referenzbereich, der angibt welcher prozentuale Anteil der Messwerte sich innerhalb der betrachteten Grenzen befindet und damit nichts mit Wahrscheinlichkeiten zu tun hat wie das Konfidenzintervall. Der 95 %-Referenzbereich beschreibt also den Bereich, der 95 % der Werte der Stichprobe enthält.