Desktop-Version

Start arrow Medien und Kommunikationswissenschaft arrow Depression – Medien – Suizid

< Zurück   INHALT   Weiter >

7.1.5 Stichprobe und Gewichtung

Telefonisch (CATI; Dual-Frame-Ansatz) wurden 2.002 Personen befragt, repräsentativ für die in Privathaushalten lebenden Personen ab 18 Jahren in der Bundesrepublik Deutschland. Die durchschnittliche Interviewdauer lag bei 31 Minuten (SD = 7 Minuten). Die Ausschöpfungsquote, definiert nach der American Association for Public Opinion Research (2011, S. 44), errechnet sich als Quotient aus der Anzahl vollständiger Interviews und der Anzahl aller wählbaren Einheiten in der Stichprobe. Die Ausschöpfungsquote der vorliegenden Untersuchung beträgt RR1 = .08 (RR3 = .09).

Die Netto-Stichprobengröße wurde am Untersuchungsziel festgemacht: Damit empirisch beobachtete Zusammenhänge in der Zielpopulation über eine angemessene statistische Power verfügen (O'Keefe, 2007), wird bei einem Signifikanzniveau von 5% eine Mindestanzahl an Personen mit erhöhter Depressivität erforderlich. [1] Zur Abschätzung dieser Teilstichprobengröße wurden mehrere Untersuchungen zur Prävalenz von Depression herangezogen (siehe Tabelle 4), die sich auf Deutschland übertragen lassen. Die Tabelle zeigt, dass die Prävalenzschätzer je nach Stichprobe und Erhebungsinstrument zum Teil deutlich variieren (Bromet et al., 2011, S. 2; Kessler & Bromet, 2013, S. 129). Es finden sich zwar kaum Studien, in denen die Datenerhebung ausschließlich telefonisch erfolgt, die Vergleichbarkeit der Prävalenzraten sollte aber dennoch gegeben sein (Crippa et al., 2008, S. 244). [2] Andererseits steht die Größenordnung dieser Zahlen im Einklang mit meta-analytischen Einschätzungen der Prävalenz von Depression (Wittchen & Jacobi, 2005, S. 365): Hier liegt die Prävalenz einer depressiven Erkrankung zwischen 3.1% und 10.1% und streut außerdem auffällig eng um einen Median von 6.9%. Auf der Grundlage dieser Untersuchungen konnte der Anteil derjenigen, die zum Befragungszeitpunkt depressive Symptome zeigen, auf 8% bis 10% in der Zufallsstichprobe geschätzt werden. Die Netto-Stichprobengröße wurde dementsprechend auf 2.000 vollständige Interviews festgelegt, so dass allein die Anzahl an Personen mit depressiven Symptomen die Stichprobenanforderungen für komplexere, multivariate statistische Verfahren erfüllt. Da für die vorliegende Untersuchung das Erreichen von Personen mit Depression von besonderer Bedeutung ist (vgl. zur Nicht-Befragung von psychisch Kranken Schnell, 1991, S. 130–132), besteht ferner das besondere Risiko, dass die Interviewer die Zielperson aufgrund einer depressiven Symptomatik nicht für fähig halten, ein telefonisches Interview zu führen. In Rücksprache mit dem Befragungsinstitut ist dieser Fall im Rahmen der vorliegenden Untersuchung jedoch nicht eingetreten. Die Stichprobe ermöglicht es, allein innerhalb der Gruppe von Personen mit erhöhter depressiver Symptomatik mit über 90% Power einen Regressionskoeffizienten der Stärke 0.2 im Rahmen multivariater Regressionsanalysen aufzudecken. [3]

Uns war es im Rahmen der vorliegenden Untersuchung wichtig, repräsentative Aussagen über die in bundesdeutschen Privathaushalten lebenden Personen ab 18 Jahren zu treffen. Die Responserate der Untersuchung liefert einen ersten Anhaltspunkt für die Qualität der Befragung (Beullens & Loosveldt, 2012). Außerdem müssten Unterschiede zwischen Respondern und Non-Respondern ermittelt werden, was im Rahmen der vorliegenden Untersuchung leider nicht möglich war, da über die Non-Responder keine Informationen existieren (Kamtsiuris et al., 2013, S. 627).

Stattdessen wurden die Befragungsteilnehmer mit der Zielpopulation hinsichtlich der zentralen Merkmale Alter, Geschlecht und formaler Bildung verglichen. Es zeigten sich dabei Unterschiede, die bereits aus anderen Telefonbefragungen bekannt sind: Wie in Tabelle 8 dargestellt, sind in der ungewichteten Stichprobe Personen mit höheren Bildungsabschlüssen über- und Personen mit niedrigeren Bildungsabschlüssen unterrepräsentiert. Um die Repräsentativität der Ergebnisse zu gewährleisten, wurden die gemeinsamen Randverteilungen der Merkmale Alter, Geschlecht und formale Bildung in der erhobenen Stichprobe an die der amtlichen Statistik (Mikrozensus 2011; vgl. kritisch zur amtlichen Statistik Schnell, 1991, S. 145) angepasst („Redressment“). [4] Es wurden verschiedene Anpassungsgewichtungen an die Gesamtbevölkerung für verschiedene Alterskategorien, Geschlecht und formale Bildung vorgenommen, um die bestmögliche Anpassung an die Grundgesamtheit zu ermitteln.

Tabelle 8. Sozialstrukturelle Merkmale in der deutschen Bevölkerung, der ungewichteten und gewichteten Untersuchungsstichprobe (Alter 5-stufig)

Dabei traten aufgrund der Stichprobenzusammensetzung vereinzelt auch extreme Gewichtungsfaktoren auf, wodurch in Analysen letztlich wiederum Verzerrungen entstehen können. Zu hohe Anpassungsgewichte wurden daher nach dem „Estimated Mean Square Error (MSE) Trimming“-Verfahren (Potter, 1990, S. 227–228) gedeckelt. Tabelle 9 gibt einen Überblick über wichtige Kennwerte der beiden verschiedenen Anpassungen an die Grundgesamtheit. Man erkennt, dass sich das Verhältnis zwischen dem größten und dem kleinsten Anpassungsgewicht durch die

max

Gewichtung nach Geschlecht, Bildungsabschluss und fünf Altersklassen (

max =

min

80.4 ) anstelle von elf Altersklassen ( min = 104.9) deutlich reduziert und dass sich

durch das Trimming-Verfahren auch die mittlere quadratische Abweichung für die herangezogene Schlüsselvariable „Depression“ verringert (vgl. allgemein zu „Trimming“-Verfahren von Gewichtungsfaktoren beispielsweise Lee, Lessler, Stuart & Biondi-Zoccai, 2011; Potter, 1988, 1990, 1993). [5]

Alle folgenden Analysen sind gewichtet nach Alter (in fünf Kategorien), Geschlecht und formaler Bildung, wobei extreme Anpassungsgewichte auf den maximalen Gewichtungswert von zwei gedeckelt wurden. Die Gewichtungsvariable wurde normalisiert.

Tabelle 9. Kennwerte der Anpassungsgewichte in der Untersuchung

  • [1] Bei komplexeren statistischen Verfahren wird oftmals eine Stichprobengröße von n = 200 als Daumenregel genannt. Kleinere Stichproben gelten in der Literatur jedoch auch als akzeptabel (Anderson & Gerbing, 1988, S. 415–416; Bentler & Yuan, 1999, S. 194; Yuan & Bentler, 1998).
  • [2] In ihrem Methodenvergleich zwischen telefonischen und Face-to-Face-Interviews zeigen Crippa et al. (2008, S. 244), dass die Prävalenzrate für Angststörungen bei der Telefonerhebung eher überschätzt wird.
  • [3] Bei der Power-Kalkulation werden Effekte mit einer Stärke von bis zu r = .05 als nicht relevant eingestuft und daher als Bestätigung der Nullhypothese angesehen.
  • [4] Zur Diskussion darüber, wie substanziell der Einfluss der Gewichtung von Befragungsdaten auf die Ergebnisse bioder multivariater Verfahren sein kann, insbesondere wenn Gewichtungsvariablen wie Alter, Geschlecht oder Bildung als Kontrollvariablen in den entsprechenden Modellen berücksichtigt werden, siehe beispielsweise Arzheimer (2009) oder Gabler und Manninger (2010).
  • [5] Es wird darüber hinaus empfohlen in einem ersten Schritt zu überprüfen, ob der kombinierte Gewichtungsfaktor negativ mit zentralen Untersuchungsgrößen korreliert ist. In diesem Fall kann das „trimming“ von Gewichtungsfaktoren zu Verzerrungen der Schätzer führen (Potter, 1990, S. 229). Dies war in der vorliegenden Untersuchung jedoch nicht der Fall.
 
< Zurück   INHALT   Weiter >

Related topics