Start Politikwissenschaft
Strukturgleichungsmodelle
|
|
|||||
2.4 Kausalität und Pfaddiagramme2.4.1 KausalitätsbegriffIn der älteren Literatur werden Strukturgleichungsmodelle häufig als „Kausalmodelle“ bezeichnet. Diese Bezeichnung erwies sich aber rasch als zu optimistisch, da per se kein statistisches Modell in der Lage ist, das Vorliegen einer kausalen Wirkung zu beweisen. Vielmehr entscheidet das Forschungsdesign, d. h. die Art und Weise, wie die Daten erhoben werden darüber, in welchem Umfang Vermutungen über kausale Zusammenhänge geprüft werden können. Um zu verstehen, warum dies der Fall ist, muss man sich zunächst darüber klar werden, wie das Konzept der Kausalität in der Forschungspraxis verwendet wird. Eines der am weitesten verbreiteten Konzepte von Kausalität (vgl. King et al. 1994, Kap. 3) basiert auf einem Gedankenexperiment, das sich am besten mittels eines Beispiels nachvollziehen lässt. In ihrer klassischen Studie zur „Autoritären Persönlichkeit“ führen Adorno et al. (1950) das Vorliegen rechtsextremer Einstellungen im Erwachsenalter auf prägende Erlebnisse in der kindlichen und frühkindlichen Entwicklungsphase zurück. Um eine präzise Messung des von der Theorie postulierten kausalen Effektes zu erhalten, müsste man einen Menschen zunächst in (einer noch näher zu definierenden Weise) autoritär erziehen und dann im Erwachsenalter einem (messfehlerfreien) Einstellungstest unterziehen. Anschließend müsste man das Leben der betreffenden Person noch einmal von vorne beginnen lassen und den Erziehungsstil systematisch im Sinne einer liberaleren Vorgehensweise variieren, alle anderen Aspekte dieses individuellen Lebens aber konstant halten. Wiederholt man dann die Messung, so entspricht die Differenz beider Messwerte dem kausalen Effekt des Erziehungsstils. Anders gewendet müssen zur Messung eines kausalen Einflusses zwei Objekte miteinander verglichen werden, die sich nur durch die Variation der unabhängigen Variablen unterscheiden und ansonsten absolut identisch sind. Die gleiche, scheinbar etwas absurde Logik lässt sich auch auf jede andere politikwissenschaftliche Forschungsfrage anwenden, wie die folgenden Beispiele zeigen: • Wie groß wäre heute die Zahl der Parteien im Bundestag, wenn die Große Koalition in den 1960er-Jahren ein Mehrheitswahlsystem eingeführt hätte? (Untersuchungsobjekt: ein Land; unabhängige Variable: Wahlsystem; abhängige Variable: Zahl der Parteien im Parlament; siehe zur Einführung Duverger 1959) • Gäbe es im südlichen Afrika weniger Bürgerkriege, wenn die Zahl der ethnischen Gruppen in diesem Raum geringer wäre? (Untersuchungsobjekt: Block von Staaten; unabhängige Variable: ethnische Heterogenität; abhängige Variable: Zahl der Bürgerkriege; siehe zur Einführung Fearon und Laitin 2003) • Wäre das Vertrauen des Bürgers Mr. Smith in den US-amerikanischen Kongress höher, wenn die Berichterstattung in den elektronischen Medien positiver wäre? (Untersuchungsobjekt: eine Person; unabhängige Variable: Medientenor; abhängige Variable: Messwert auf einer Vertrauensskala; siehe zur Einführung Robinson 1976) In der Forschungspraxis lassen sich die Konsequenzen der kontrafaktischen („was wäre wenn“) Annahmen aus offensichtlichen Gründen nicht beobachten, so dass Kausalität im eigentlichen Sinne nicht geprüft werden kann. Dennoch sind diese Gedankenexperimente überaus nützlich. Erstens lassen sich aus ihrer Darstellung eine Reihe von Bedingungen ableiten, die erfüllt sein müssen, damit von einer kausalen Beziehung gesprochen werden kann. Zwei solche notwendigen Bedingungen ergeben sich unmittelbar aus der Beschreibung des Experiments: Die potentielle Ursache muss der Wirkung zeitlich vorausgehen, und ein Einfluss anderer Variablen muss ausgeschlossen werden können, damit von Kausalität gesprochen werden kann. Zweitens zeigen die Gedankenexperimente, wie man sich in der Realität durch die Wahl eines geeigneten Forschungsdesigns an das Konzept der Kausalität herantasten kann. Am besten dafür geeignet ist ein echtes EXPERIMENTALDESIGN mit Randomisierung (Jackson und Cox 2013). Hier treten an die Stelle des einzelnen Untersuchungsobjektes, dessen unabhängige Variable in Gedanken variiert wird, Gruppen von Untersuchungsobjekten, die durch die Ausprägungen der unabhängigen Variablen definiert sind. Die einfache Differenz zweier Messwerte wird durch die Berechnung des statistischen Zusammenhangs zwischen Gruppenzugehörigkeit und individuellen Messwerten ersetzt. Beispielsweise könnte man eine Reihe von Fernsehzuschauern mit positiven politischen Nachrichten konfrontieren, während einer zweiten Gruppe von Zuschauern kritischere Programme gezeigt werden. Anschließend kann man die Mittelwerte für die Vertrauensskala in beiden Gruppen vergleichen bzw. die Korrelation zwischen Gruppenzugehörigkeit und individuellem Vertrauenswert errechnen. Dabei ist es von zentraler Bedeutung, dass die Untersuchungspersonen zufällig auf beide Gruppen aufgeteilt werden. Zwar wird auch durch eine zufällige Aufteilung nicht garantiert, dass die Gruppen bezüglich aller anderen Variablen, die einen Einfluss haben könnten, identisch sind. Bei einer hinreichend großen Zahl von Versuchspersonen ist es aber sehr unwahrscheinlich, dass es zu nennenswerten systematischen Unterschieden zwischen beiden Gruppen kommt. Das Experimentaldesign ersetzt also ein identisches Paar von Objekten durch zwei aller Wahrscheinlichkeit nach sehr ähnliche Gruppen von Objekten, womit die zweite Bedingung für die Messung einer kausalen Wirkung zumindest näherungsweise erfüllt ist. Auch die Frage der korrekten zeitlichen Reihenfolge ist im Experimentaldesign unproblematisch. Erstaunlicherweise hat das Experimentaldesign gegenüber dem Gedankenexperiment sogar einen erheblichen Vorteil. Letzteres setzt eine fehlerfreie Messung der abhängigen Variablen voraus, da ansonsten der kausale Effekt unteroder überschätzt würde. Im Experimentaldesign sollten sich – wiederum bei hinreichender Gruppengröße – zufällige Messfehler mit großer Wahrscheinlichkeit gegenseitig neutralisieren. Problematisch sind lediglich solche Messfehler, die systematisch mit der Gruppenzugehörigkeit zusammenhängen, weil diese zu verzerrten Schätzungen führen. Bei sorgfältiger Planung des Experiments und der Messung ist es jedoch aufgrund der zufälligen Aufteilung der Untersuchungspersonen erneut nicht sehr wahrscheinlich, dass solche Effekte auftreten. Aufgrund dieser Vorteile erfreuen sich Experimente in der Politikwissenschaft wachsender Beliebtheit (Faas und Huber 2010). Vor allem in der politikwissenschaftlichen Einstellungsforschung werden experimentelle Anordnungen zusehends in das traditionelle Instrumentarium der Befragung integriert. In den allermeisten Anwendungsfällen ist es jedoch unmöglich, die unabhängige Variable (beispielsweise das Wahlrecht) zufällig zu variieren und dann die Auswirkungen in den verschiedenen Gruppen zu beobachten. Vielmehr werden die Ausprägungen der unabhängigen Variablen durch soziale und politische Faktoren hervorgebracht, die sich der Kontrolle durch den Forscher entziehen, der hier lediglich die Resultate dieser Prozesse aufzeichnen kann. Dieses Forschungsdesign wird deshalb als EXPOST-FACTO-DESIGN bezeichnet. In einem Ex-post-facto-Design ist es nur sehr eingeschränkt möglich, kausale Effekte zu messen. Zum einen ist es schwierig, den Einfluss anderer Variablen auszuschließen, die mit der kausalen Variable korreliert sind. Im echten Experiment werden alle nur denkbaren Hintergrundvariablen durch die Randomisierung „konstant gehalten“: Ihre Verteilung sollte in allen Gruppen etwa gleich sein, so dass sich eventuelle Effekte nicht auf die Mittelwertdifferenzen bzw. Korrelationen auswirken. Im Ex-post-facto-Design lässt sich ein ähnlicher Effekt erreichen, indem die Hintergrundvariablen explizit in ein Regressionsmodell aufgenommen werden. Dadurch wird der Einfluss der Hintergrundvariablen aus der Schätzung für den Effekt der kausalen Variablen herausgerechnet. Diese Strategie wird auch als statistische Kontrolle bezeichnet. Die statistische Kontrolle setzt jedoch voraus, dass 1) die Hintergrundvariablen bekannt sind, 2) gemessen werden und 3) unabhängig von der kausalen Variable variieren. Zudem nimmt 4) mit der Zahl der Kontrollvariablen auch die Zahl der benötigten Fälle zu. In der politikwissenschaftlichen Umfrageforschung sind vor allem die beiden ersten Punkte häufig problematisch. Wenn eine potentiell relevante Hintergrundvariable zum Zeitpunkt der Datenerhebung nicht identifiziert wurde, ist eine Erhebung im Nachhinein in der Regel nicht mehr möglich. In der vergleichenden Politikwissenschaft und den internationalen Beziehungen bereiten hingegen vor allem die beiden letzten Bedingungen Schwierigkeiten, da die Zahl der Staaten nicht vermehrbar ist und viele relevante Eigenschaften kaum variieren bzw. hochgradig miteinander korreliert sind. In dem oben auf Seite 42 genannten Beispiel etwa könnten neben der ethnischen Fraktionalisierung z. B. auch eine ungünstige Grenzziehung durch die Kolonialmächte, klientelistische Beziehungen zwischen Bevölkerung und Politikern und ein hoher Anteil junger Männer an der Bevölkerung für die große Zahl der Konflikte verantwortlich sein. Ein kausaler Effekt ist hier schwer zu prüfen, da fast alle Staaten bzw. Paare von Staaten in ähnlicher Form von diesen Faktoren betroffen sind. Hinzu kommt ein weiteres Problem: Häufig ist die zeitliche und kausale Reihenfolge von abhängiger und unabhängiger Variable nicht völlig klar. Beispielsweise ist es durchaus plausibel anzunehmen, dass sich ein ohnehin misstrauischer Bürger verstärkt besonders kritischen Nachrichtensendungen zuwenden wird. In ähnlicher Weise lässt sich argumentieren, dass Parteien in historischer Perspektive das Wahlrecht im Sinne ihrer eigenen Interessen geändert haben, so dass die Zahl der bereits vorhandenen Parteien die Entscheidung für ein bestimmtes Wahlsystem bzw. die Chancen einer Wahlrechtsänderung entscheidend mitbeeinflusst (Colomer 2005). In beiden Fällen wäre also die vermeintliche Ursache tatsächlich eine Folge der vermuteten Wirkung [1]. Dieses Phänomen wird oft mit dem Begriff der ENDOGENITÄT in Zusammenhang gebracht (siehe dazu auch Seite 47) [2]. Im Ergebnis zeigt sich in allen Fällen zwischen abhängiger und unabhängiger Variable eine Korrelation. Diese kann jedoch nicht kausal interpretiert werden, weil aufgrund des Designs die zeitliche Reihenfolge von abhängiger und unabhängiger Variable unklar ist. Dies ist ein grundsätzliches Problem, für das keine einfache statistische Lösung existiert. Dass in der älteren Literatur Strukturgleichungsmodelle als „Kausalmodelle“ bezeichnet werden, führt deshalb tendenziell in die Irre: Strukturgleichungsmodelle erleichtern das Denken in und die Modellierung von komplexen kausalen Strukturen, können aber nicht dazu dienen, fundamentale Probleme bei der Datenerhebung zu kompensieren. Selbstverständlich ist diese Erkenntnis keineswegs neu. Gerade in den letzten Jahren hat aber das Interesse an Designs und theoretischen Überlegungen, mit denen man sich an der Prüfung von Kausalaussagen zumindest annähern kann, in allen Sozialwissenschaften generell wieder sehr stark zugenommen (Morgan und Winship 2007). Im Bereich der Strukturgleichungsmodelle hat vor allem Judea Pearl in einer Reihe von teils kontrovers diskutierten Beiträgen immer wieder darauf hingewiesen, dass diese unter bestimmten Umständen besonders gut geeignet sein können, um (Teile von) Kausalaussagen zu testen, weil Informationen über Design und die Struktur der zugrundeliegenden Theorie systematisch berücksichtigt werden können (zuletzt Pearl 2012).
|
<< | INHALT | >> |
---|
Related topics |