Stichprobe ziehen und Datenerhebung
Studiendurchführung
Skalenniveaus
Wenn wir eine geeignete zufällige Stichprobe aus der Grundgesamtheit gezogen haben, geht es nun darum, die relevanten Daten der Proband:innen der Stichprobe zu erheben (welche dies genau sind, wurde bereits in der Studienplanung genau definiert) und anhand dieser die Stichprobe zu beschreiben. Die erfassten Eigenschaften werden als Variablen bezeichnet, da sie von Proband:in zu Proband:in variieren können und entsprechend verschiedene Ausprägungen möglich sind. Welche Methoden der deskriptiven Statistik für die Beschreibung der jeweiligen Variablen geeignet sind, hängt vom Skalenniveau dieser ab. Das Skalenniveau einer Variablen wird durch die Anzahl und Art der möglichen Ausprägungen bestimmt und im weiteren Verlauf dieses Abschnitts genauer betrachtet.
Beispiel "Blutdrucksenker"
In unserer Studie zur Untersuchung des Blutdrucksenkers werden die 100 Patient:innen in zwei gleich große Behandlungsgruppen eingeteilt (Standardtherapie und neue Intervention). Erhoben werden die folgenden Variablen:
- Gruppenzuteilung: 1 = Interventionsgruppe, 0 = Kontrollgruppe (gruppe)
- Geschlecht: männlich oder weiblich* (geschlecht)
- Alter: in Jahren (alter)
- Körpergröße: in cm (grösse)
- Gewicht: in kg (gewicht)
- Sportliche Aktivität: Selbsteinschätzung; keine, wenig, mittel, viel (sport)
- Systolischer Blutdruck bei Aufnahme: in mmHg (sogenannter Baselinewert) (BD_vor)
- Systolischer Blutdruck nach 5 Wochen: in mmHg (BD_nach)
- Zeit bis Blutdruck im Normbereich (< 140 mmHg): Anzahl Tage nach Studienbeginn, an dem Blutdruck im Normbereich oder Tag des Beobachtungsendes (zeit_BD_norm)
- Blutdruck bis zum Studienende oder Ausscheiden aus der Studie in den Normbereich (< 140 mmHg) gesunken?: ja oder nein (BD_norm)
- Adhärenz?: ja (Einnahme von mehr als 90 % der Studienmedikation) oder nein (adhär)
*Es wurde auch die Option „divers“ im Fragebogen angeben, allerdings hat in unserer Stichprobe von 100 Patient:innen keine/r diese Option gewählt, sodass wir diese Kategorie in der weiteren Analyse ignoriert haben.
Tabelle 1 zeigt die Ergebnisse der ersten 10 Studienteilnehmer:innen. Auffällig ist erstmal nur, dass die Versuchsperson mit der ID 6 frühzeitig an Tag 18 aus der Studie ausgeschieden ist (Drop-Out), denn es findet sich kein Ergebnis der zweiten Blutdruckmessung in ihrer Datenreihe. Bei ihrer letzten Messung an Tag 18 war ihr Blutdruck noch nicht in den Normbereich gesunken (BD_norm=“nein“).
Tab. 1: Beispieldaten
ID | gruppe | geschlecht | alter | grösse | gewicht | sport | BD_vor | Bd_nach | zeit_BD_norm | BD_norm | adhär |
---|---|---|---|---|---|---|---|---|---|---|---|
1 | 0 | weiblich | 72 | 157 | 58,2 | mittel | 181 | 154 | 24 | nein | ja |
2 | 0 | männlich | 67 | 182 | 84,8 | mittel | 164 | 144 | 35 | nein | ja |
3 | 1 | männlich | 59 | 170 | 79,3 | keine | 149 | 122 | 5 | ja | ja |
4 | 0 | weiblich | 38 | 168 | 68,7 | wenig | 150 | 128 | 13 | ja | ja |
5 | 1 | männlich | 65 | 191 | 86,4 | keine | 147 | 129 | 3 | ja | ja |
6 | 1 | weiblich | 47 | 162 | 78,3 | viel | 172 | – | 18 | nein | nein |
7 | 0 | männlich | 36 | 195 | 90,6 | viel | 150 | 136 | 17 | ja | ja |
8 | 1 | männlich | 53 | 185 | 111,3 | keine | 183 | 148 | 35 | nein | ja |
9 | 0 | männlich | 68 | 178 | 85,4 | mittel | 167 | 143 | 35 | nein | ja |
10 | 1 | weiblich | 46 | 170 | 79,1 | mittel | 151 | 134 | 17 | ja | ja |
… | … | … | … | … | … | … | … | … | … | … | … |
Die Variablen lassen sich grundsätzlich in kategoriale und metrische Variablen einordnen.
Die Ausprägungen kategorialer Variablen sind, wie der Name schon vermuten lässt, einzelne Kategorien. Hierbei wird weiterhin zwischen kategorialen Variablen auf der Nominal– und der Ordinalskala unterschieden: Die Ausprägungen ordinal skalierter Variablen lassen sich logisch ordnen, was bei nominal skalierten Variablen nicht der Fall ist. Besitzt eine kategoriale Variable genau zwei Ausprägungen, dann spricht man von einer dichotomen (oder binären) Variablen.
Metrische Variablen haben Zahlenwerte als Ausprägungen und es sind (im Gegensatz zu kategorialen Variablen) Berechnungen z. B. von Differenzen oder Mittelwerten möglich und sinnvoll.
Beispiel "Blutdrucksenker"
Die Gruppenzuteilung, das Geschlecht, die sportliche Aktivität und die Variable BD_norm sind kategoriale Variablen, da ihre Ausprägungen jeweils zwei oder mehr Kategorien aufweisen.
Weder das Geschlecht und die Gruppenzugehörigkeit noch die Variable BD_norm besitzen eine Rangordnung, d. h. sie sind nominalskaliert. Außerdem besitzen diesen Variablen jeweils nur zwei Ausprägungen, weshalb sie auch als dichotom bezeichnet werden.
Im Gegensatz dazu lassen sich die vier Ausprägungen der sportlichen Aktivität anordnen (keine < wenig < mittel < viel) und damit ist diese Variable ordinalskaliert.
Bei Alter, Größe, Gewicht und den Messwerten des systolischen Blutdrucks handelt es sich hingegen um metrische Variablen, weil ihre Ausprägungen Zahlenwerte annehmen.
Ein weiteres Skalenniveau, das hier betrachtet werden soll, ist die Ereigniszeitskala (oder auch survival time). Variablen auf der Ereigniszeitskala beschreiben die Zeit, bis ein bestimmtes Ereignis (ein Ja/Nein-Ereignis) eingetreten ist oder bis die Beobachtungszeit beendet wird (z. B. Studienende) – es werden also die Zeit und das Ereignis im Zusammenhang betrachtet. Tritt das betrachtete Ereignis bis zum Beobachtungsende nicht ein oder scheidet eine Versuchsperson schon vor Studienende aus der Untersuchung aus, findet eine sogenannte Zensierung statt, da dann kein beobachtetes Ergebnis vorliegt.
Beispiel "Blutdrucksenker"
In unserem Beispiel ist die Zeit, bis der systolische Blutdruck wieder in den Normbereich (< 140 mmHg) gesunken ist (zeit_BD_norm), eine Variable auf der Ereigniszeitskala. Bei einigen Patient:innen tritt dieses Ereignis vor Studienende ein, bei anderen hingegen nicht.
Zusammenfassung
Variable(n) | Beispiel | Operationen | |
---|---|---|---|
Nominalskala | kategorial | Gruppenzugehörigkeit, Geschlecht | Häufigkeitsauszählung |
Ordinalskala | Sportliche Aktivität | Vergleichen <, ≤, =, ≥, > | |
Metrische Skala | metrisch | Alter, Größe, Gewicht, Blutdruck | Summe, Differenzen, Produkte, Verhältnisse +, -, *, : |
Ereigniszeitskala | metrisch + dichotom | Zeit bis Blutdruck im Normbereich | Summe, Differenzen, Produkte, Verhältnisse (metrischer Teil), Häufigkeitsauszählung (dichotomer Teil) |
LITERATURVERZEICHNIS
Die Inhalte dieser Seite sind angelehnt an: