Desktop-Version

Start arrow Politikwissenschaft arrow Strukturgleichungsmodelle

  • Increase font
  • Decrease font


<<   INHALT   >>

3 Beispiele und Anwendungen

Example has more followers than reason.

Christian Nestell Bovee

3.1 Daten

Die Beispiele in diesem und im folgenden Kapitel basieren auf der „Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften“ (ALLBUS, gesis. org/allbus/allbus-home/) und dem European Social Survey (ESS, europeansocialsurvey.org/). Beide Studien werden als öffentlich finanzierte Infrastrukturprojekte im Abstand von jeweils zwei Jahren durchgeführt; der ALLBUS seit 1980, der ESS seit 2002. Auch die Struktur beider Studien ist ähnlich: Die Daten decken eine Vielzahl von politikund sozialwissenschaftlichen Fragestellungen ab, sind von anerkannt hoher Qualität und für die Zwecke von Forschung und Lehre frei im Internet zugänglich. Neben einem Kern von Items, der in jeder Welle repliziert wird, gibt es in beiden Projekten Module, die spezifischere Fragestellungen abdecken. Allerdings beschränkt sich der ALLBUS auf Deutschland. Der ESS hingegen umfasst inzwischen mehr als 30 europäische Länder.

Zusätzliche Daten, die in Kap. 4.2 genutzt werden, stammen aus der German Longitudinal Election Study (GLES, gles.eu). Auch die GLES wird aus Steuermitteln finanziert und macht ihre Daten über das Internet zugänglich.

Während jeder einzelne Datensatz der drei Studien mehrere hundert Items umfasst, werden für die Beispiele in diesem Kapitel jeweils nur eine Handvoll von Variablen benötigt. Die für die Analyse benötigten Daten werden in aufbereiteter Form auf der Homepage zum Buch zur Verfügung gestellt (kai arzheimer.com/beispiele-sem).

3.2 Konfirmatorische Faktorenanalyse: Einstellungen zu Migranten

Seit dem Zweiten Weltkrieg sind fast alle westeuropäischen Gesellschaften zum Ziel von Migranten geworden, die selbst nicht aus westeuropäischen Ländern stammen. Die einheimischen Bevölkerungen reagieren auf dieses Phänomen häufig mit Ablehnung. Diese negativen Einstellungen lassen sich analytisch in vielfältiger Weise unterteilen (z. B. in Stereotype, Ängste, Handlungsabsichten ... ). Unter den Ängsten lassen sich idealtypisch zwei Dimensionen unterscheiden: Von primär sozio-ökonomische Befürchtungen bezüglich einer verschärften Konkurrenz um Arbeitsplätze und Sozialleistungen kann man Gefühle einer Bedrohung der eigenen Lebenswelt durch die fremden Kulturen abgrenzen (Mughan und Paxton 2006).

Auch wenn diese Unterscheidung auf den ersten Blick plausibel erscheint, so stellt sich doch die Frage, ob Bedrohungsgefühle in der Praxis tatsächlich diese zweidimensionale Struktur aufweisen. Denkbar wäre beispielsweise auch, dass sich die Ablehnung der Migranten auf alle Lebensbereiche bezieht, d. h. dass sich kulturelle und sozio-ökonomische Aspekte empirisch gar nicht voneinander unterscheiden lassen.

Mit Hilfe der ersten Welle des ESS lässt sich diese Frage empirisch prüfen. Der Fragebogen dieser Welle enthält u. a. zwei Items, die sozio-ökonomische Bedrohungsgefühle erfassen:

1. „Was würden Sie sagen, nehmen Zuwanderer, die hierher kommen, im Allgemeinen Arbeitnehmern in Deutschland die Arbeitsplätze weg oder helfen sie im Allgemeinen, neue Arbeitsplätze zu schaffen?“ (nehmen Arbeitsplätze weg

(10) – schaffen neue Arbeitsplätze (0), imtcjob)

2. „Die meisten Zuwanderer, die hierher kommen, arbeiten und zahlen Steuern. Sie nehmen außerdem das Gesundheitssystem und Sozialleistungen in Anspruch. Wenn Sie abwägen, denken Sie, dass Zuwanderer mehr bekommen als sie geben, oder mehr geben, als sie bekommen?“ (bekommen mehr (10) – geben mehr (0) imbleco)

Zwei weiterer Items lassen sich der kulturellen Dimension zuordnen:

3. „Würden Sie sagen, dass das kulturelle Leben in Deutschland im Allgemeinen durch Zuwanderer untergraben oder bereichert wird?“ (untergraben (10) – bereichert (0) imueclt)

4. „Wird Deutschland durch Zuwanderer zu einem schlechteren oder besseren Ort zum Leben?“ (schlechterer Ort (10) – besserer Ort (0) imwbcnt)

Alle vier Items sind so kodiert, dass hohe Werte für ablehnende, niedrige Werte hingegen für positive Einstellungen gegenüber Zuwanderern stehen. Gleichung (3.1) zeigt die zugehörige Varianz-Kovarianz-Matrix S sowie die entsprechende Korrelationsmatrix R.

Zwischen allen vier Items bestehen moderate positive Zusammenhänge. Im Einklang mit den theoretischen Vermutungen sind diese zwischen Item 3 und 4 mit einer Korrelation von 0.61 stärker ausgeprägt als etwa zwischen Item 3 und 2 (0.35). Item 1 allerdings steht mit allen anderen Items in einem etwa gleich starken Zusammenhang, was eher dafür sprechen würde, dass die vier Items eine gemeinsame Dimension erfassen.

Abbildung 3.1 stellt die beiden alternativen Modelle graphisch dar: In Abb. 3.1a repräsentieren die beiden ersten Items eine ökonomische, die beiden anderen Items eine kulturelle Subdimension. Der Doppelpfeil zwischen den Faktoren repräsentiert eine vermutete Kovarianz zwischen beiden Unterdimensionen. In Abb. 3.1b hingegen steht ein gemeinsamer Faktor hinter den Messungen [1].

Welches Modell besser mit den Daten vereinbar ist, lässt sich ermitteln, indem die entsprechenden Strukturgleichungsmodelle geschätzt werden. Wie leicht dies in Stata möglich ist, zeigt Listing 3.1.

In Zeile 2 wird zunächst der Datensatz mit den vier Variablen eingelesen. Zeile 5 spezifiziert dann das Modell: Mit dem ←-Symbol werden die Items imtcjob

Abb. 3.1 Dimensionen der Ausländerfeindlichkeit

1 * Datensatz laden

2 use ess w1 cfa , clear

3

4 * Zweidimensionales Modell , ML Schaetzung , standardisierte Faktoren

5 sem ( imtcjob <OEK ) ( imbleco <OEK ) ( imueclt <CULT ) ///

6 ( imwbcnt <CULT ) , means ( OEK@0 CULT@0 ) var ( OEK@1 CULT@1 )

7

8 * Schaetzungen speichern

9 est store zweiml

10 estat eqgof

11 estat gof , stats ( ic rmsea indices )

12

13 * Eindimensionales Modell , ML Schaetzung , standardisierte Faktoren

14 sem ( imtcjob <XEN ) ( imbleco <XEN ) ( imueclt <XEN ) ///

15 ( imwbcnt <XEN ) , means ( XEN@0 ) var ( XEN@1 )

16 est store einml

17 estat eqgof

18 estat gof , stats ( ic rmsea indices )

Listing 3.1 CFA in Stata

und imbleco als Indikatoren für latente ökonomische Bedrohungsgefühle (OEK) definiert. Analog dazu werden die Items imueclt und imwbcnt als Indikatoren für kulturelle Bedrohungsgefühle (CULT) festgelegt. Jede dieser Zuweisungen ist in ein Klammerpaar eingeschlossen.

Das Modell lässt sich noch etwas kompakter formulieren, indem Zuweisungen zusammengefasst werden: (imtcjob ← OEK) (imbleco ← OEK) und (imtcjob imbleco ← OEK) führen zum gleichen Ergebnis. Der Pfeil kann dabei auch umgekehrt werden: (imtcjob ← OEK) und (OEK → imtcjob) sind äquivalent. Wichtig ist nur, dass die Indikatoren auf der Seite der Pfeilspitze stehen.

Außerdem ist zu beachten, dass Stata Variablen, deren Namen mit einem Großbuchstaben beginnt, als latente Variablen betrachtet. Ist dies nicht gewünscht, so können diese Voreinstellung mit der Option nocapslatent deaktiviert oder die latenten Variablen mit der Option latent() explizit benannt werden.

Abgetrennt durch ein Komma folgen dann die Optionen: means und var legen die Metrik, d. h. Mittelwerte bzw. Varianzen der latenten Variablen fest (vgl. Abschn. 2.6.3, Seite 61). Hinter dem „at“-Zeichen (@) steht dabei der gewünschte Wert [2]. Werden diese Angaben weggelassen, setzt Stata die Ladung des jeweils ersten Indikators auf den Wert von 1 und fixiert so die Varianz des Faktors. Voreinstellung für das Schätzverfahren ist das ML-Verfahren. Weitere Angaben sind nicht erforderlich, da Stata (wie alle gängigen Programme) ebenfalls per Voreinstellung eine Korrelation zwischen den beiden latenten Variablen schätzt.

Wichtig ist, dass (wie bei jedem Stata-Kommando) die vollständige Modellspezifikation in einer einzigen Zeile stehen muss. Da dies schnell unübersichtlich werden kann, besteht die Möglichkeit das Zeilenende durch drei Schrägstriche (///) zu maskieren und die Eingabe in der nächsten Zeile (hier Zeile 6) fortzusetzen. Nach dem Absetzen dieses Kommandos werden die Modellschätzungen ausgegeben, die dann mit est store unter einem frei wählbaren Namen gespeichert werden können (Zeile 9).

In der Logik des Strukturgleichungsmodells werden die beobachteten Indikatoren auf die latenten Variablen regrediert. Zu jedem Indikator gehört deshalb ein eigenes R2, das angibt, wieviel Prozent der Varianz des Indikators auf die latente(n) Variable(n) zurückgeht. Mit estat eqgof in Zeile 10 werden diese „goodness of f it“-Werte für jede Gleichung („equation“) der Messmodelle ausgegeben. In Zeile 11 fordert estat gof zusätzliche globale Anpassungsmaße an, die weiter unten im Text diskutiert werden.

Tabelle 3.1 zeigt die wichtigsten Ergebnisse dieser ersten Schätzung. Für jeden der vier Indikatoren ist jeweils ein Pfadkoeffizient, d. h. eine Faktorladung ausgewiesen, der wie ein Regressionskoeffizient zu interpretieren ist: Bei einer Zunahme der latenten Variable „ökonomische Bedrohungsgefühle“ um eine Standardabweichung ist beispielsweise mit einer Zunahme der Zustimmung zum ArbeitsplätzeItem imtcjob um 1.3 Skalenpunkte zu rechnen.

Darüber hinaus enthält Tab. 3.1 für jedes Item den Effekt einer Konstanten, d. h. einen Achsenabschnitt. Dieser entspricht dem erwarteten Wert des jeweiligen Indikators, wenn der Wert der latenten Variablen bei ihrem Mittelwert von 0 liegt. Bei diesem einfachen Modell entsprechen die Achsenabschnitte dem jeweiligen empirischen Mittelwert der Items.

Ladung/Achsenabschnitt

imtcjob: OEK

1.321∗∗∗

(0.0522)

imtcjob: Konstante

4.372∗∗∗

(0.0472)

imbleco: OEK

1.296∗∗∗

(0.0542)

imbleco: Konstante

4.019∗∗∗

(0.0496)

imueclt: CULT

1.603∗∗∗

(0.0556)

imueclt: Konstante

6.308∗∗∗

(0.0548)

imwbcnt: CULT

1.809∗∗∗

(0.0532)

imwbcnt: Konstante

4.997∗∗∗

(0.0521)

cov(OEK,CULT)

0.826∗∗∗

(0.0239)

Stata nimmt per Voreinstellung Achsenabschnitte in das Modell auf, weil das Programm normalerweise Zugriff auf die Rohdaten hat. In älteren Programmen, die aus einer Zeit stammen, als primär Korrelationsund Kovarianzmatrizen analysiert wurden, die keine Informationen zur Höhe der Messwerte mehr enthalten, müssen die Achsenabschnitte teilweise explizit in das Modell aufgenommen werden.

Die letzte Zeile in Tab. 3.1 schließlich enthält die Kovarianz zwischen beiden Faktoren. Da deren Metrik durch die var-Optionen standardisiert ist, reduziert sich die Kovarianz auf eine Korrelation und ist deshalb leicht zu interpretieren.

Der vom Programm geschätzte Wert liegt mit 0.83 recht hoch. Zwischen kulturellen und ökonomischen Bedrohungsgefühlen besteht also ein starker positiver Zusammenhang.

Dieser ist jedoch keineswegs perfekt: Die gemeinsame Varianz beider Faktoren beträgt 0.832 ≈ 69 %, so dass es vermutlich sinnvoll ist, an der Vorstellung zweier verwandter, aber separierbarer Dimensionen festzuhalten. Genaueres lässt

sich dazu sagen, wenn alternativ ein eindimensionales Modell geschätzt wird. Dies

Tab. 3.2 Eine Dimension der Ausländerfeindlichkeit

geschieht in Zeile 14/15 von Listing 3.1, die alle vier Indikatoren einem gemeinsamen Faktor Xenophobie (XEN) zuordnet. Varianz und Mittelwert dieses Faktors werden analog zu Zeile 6 auf die Werte 1 bzw. 0 fixiert. Auch hier werden die Ergebnisse wieder zur weiteren Betrachtung gespeichert (Zeile 16) sowie zusätzlich Anpassungsmaße angefordert (Zeile 17/18).

Tabelle 3.2 zeigt die Faktorladungen, die insgesamt geringfügig niedriger ausfallen als bei der zweidimensionalen Lösung. Die Achsenabschnitte sind wiederum mit den empirischen Mittelwerten identisch.

Tabelle 3.3 enthält Kriterien, anhand derer beide Spezifikationen miteinander verglichen werden können. Die erste Zeile zeigt die durch das Modell „verbrauchten“ Freiheitsgrade, d. h. die Zahl der Parameter des Modells [3]. Was es damit auf sich hat, lässt sich im Beispiel leicht nachvollziehen.

Tab. 3.3 Dimensionen der Ausländerfeindlichkeit: Modellvergleich

Die Beobachtung von vier Variablen resultiert aus der Perspektive des Schätzverfahrens in insgesamt 14 unabhängige Informationen: vier Mittelwerte, vier Varianzen und 4×3 = 6 Kovarianzen. Diese Überlegung lässt sich verallgemeinern: Aus p beobachteten Variablen ergeben sich 2 × p + p×(p−1) Freiheitsgrade.

Ein sehr sparsames, wenn auch inhaltlich wenig interessantes Basismodell, das überhaupt keine latenten Variablen enthält, hätte acht Parameter (Mittelwert und Varianz für jeden Indikator) und verbraucht entsprechend viele Freiheitsgrade. Maximal möglich wären 14 Parameter – damit wäre ein Modell gerade noch identifiziert. Es blieben dann aber keine Freiheitsgrade übrig, die zur Beurteilung der Modellgüte genutzt werden könnten, da ein solches gesättigtes Modell die empirischen Daten stets perfekt reproduziert.

Die Differenz zwischen der Zahl der Parameter des des aktuellen Modells und der Zahl der Parameter eines gesättigten Modells wird in der Literatur meist als „model degrees of freedom“ (dfM ) bezeichnet (siehe Fußnote 3, Seite 79) und ist in der zweiten Zeile aufgeführt. Sie ist auch die Grundlage für den klassischen χ 2Test der Modellgüte, der aber in größeren Stichproben von mehr als 200 bis maximal 500 Fällen wenig hilfreich ist, da er auch triviale Abweichungen zwischen dem aktuellen und dem gesättigten Modell als signifikant und damit problematisch markiert (Abschn. 2.6.4). Dies zeigt sich auch hier wieder: Gemessen an der geringen Zahl von 1 bzw. 2 Freiheitsgraden sind beide χ 2-Werte (dritte Zeile) hochsignifikant, d. h. keines der Modelle könnte als angemessen gelten [4].

Folglich müssen andere Kriterien herangezogen werden. Die Zwei-FaktorenLösung liegt mit 13 Parametern (für jeden Indikator werden Achsenabschnitt, Fehlervarianz und Faktorladung geschätzt, hinzu kommt die Kovarianz zwischen den Faktoren) dicht an am Extrempol des gesättigten Modells, während das Modell mit einem einzigen gemeinsamen Faktor zumindest einen Parameter weniger enthält, also sparsamer ist.

Allerdings lässt sich mit dem komplexeren Modell eine deutlich weniger negative logarithmierte Likelihood erzielen (vorletzte Zeile), was einer höheren Likelihood entspricht. Das Zwei-Faktoren-Modell ist also besser mit den Daten vereinbar. Gemessen an einem Rückgang der Log-Likelihood um ca. 26 Punkte (der wiederum der Hälfte der Differenz zwischen beiden χ 2-Werten entspricht) ist der Verlust eines Freiheitsgrades zu verschmerzen. Dies lässt sich am BIC (vierte Zeile von oben) ablesen, das, wie oben dargelegt, Modellanpassung und Komplexität des Modells berücksichtigt. Der niedrigere Wert in der zweiten Spalte signalisiert, dass der Zwei-Faktoren-Lösung nach diesem Kriterium der Vorzug zu geben ist.

Dies zeigt auch der RMSEA: Der Wert von 0.137 für das einfachere Modell ist nach den gängigen Kriterien eindeutig zu hoch, während mit dem komplexeren Modell die Region des akzeptablen bis guten Fit erreicht ist (vgl. Abschn. 2.6.4, Seite 63). Der TLI (vierte Zeile von unten) bestätigt dieses Bild: Für das einfaktorielle Modell liegt der Index unter, für das zweifaktorielle Modell über dem gängigen Schwellenwert von 0.95 (Seite 64). Insgesamt präsentiert sich die Zwei-FaktorenLösung damit als durchaus akzeptables Modell für die Struktur ausländerfeindlicher Einstellungen.

Dies sollte allerdings nicht darüber hinwegtäuschen, dass die Qualität des Messmodells durchaus weiter verbessert werden könnte. Die R2-Werte (nicht tabellarisch ausgewiesen) bewegen sich im Bereich zwischen 0.41 (imbleco) und 0.73 (imwbcnt). Für Umfrageinstrumente sind dies durchaus gute Ergebnisse. Dennoch bedeutet dies inhaltlich, dass fast 60 % der Varianz von imbleco auf Messfehler zurückzuführen sind. In der Vorstudie zu einem Primärforschungsprojekt wäre dies ein Anlass, die Zahl der Indikatoren auf wenigstens drei, besser vier pro Faktor zu erhöhen und dabei auch nach noch besseren, d. h. reliableren Instrumenten zu suchen. Bei der Sekundäranalyse bereits erhobener Daten ist dies aber naturgemäß nicht oder nur sehr eingeschränkt möglich.

Ein großer Vorteil von Stata besteht darin, dass das sem-Kommando vollständig in das Paket integriert ist und analog zu allen übrigen Befehlen arbeitet. Dadurch ist es einerseits möglich, alle eventuell erforderlichen Rekodierungen und Transformationen direkt in Stata vorzunehmen. Andererseits können die Schätzergebnisse wie oben gezeigt mit est store gespeichert und dann weiter analysiert werden. Dies erleichtert die Produktion von Tabellen und Grafiken, aber auch den Vergleich

1 Raw Data From File ess w1 cfa . lsf

2 Latent Variables: OEK CULT

3 Relationships

4 imtcjob = CONSTANT + OEK

5 imbleco = CONSTANT + OEK

6 imueclt = CONSTANT + CULT

7 imwbcnt = CONSTANT + CULT

8 End of Problem

Listing 3.2 CFA in LISREL

konkurrierender Modelle und Schätzverfahren enorm. Beispielsweise kann die Modellschätzung allein durch Hinzufügen der Option method(adf) mit WLS/ADF wiederholt werden. Die alternativen Parameterschätzungen können dann mit est store gespeichert und anschließend mit Hilfe von est tab den ML-Schätzungen gegenübergestellt werden.

Auch in anderen Programmen lassen sich die beiden konfirmatorischen Modelle aber mit wenigen Zeilen implementieren. Listing 3.2 enthält die notwendigen Anweisungen für LISREL in der SIMPLIS-Syntax.

Zeile 1 lädt den Datensatz in LISRELs binärem Format, das hier als „roh“ bezeichnet wird, da das Programm standardmäßig immer noch die Eingabe von Kovarianzbzw. Korrelationsmatrizen im Programmtext erwartet. Datensätze wie der ESS oder der ALLBUS werden von den Datenarchiven zumeist im Stataoder SPSS-Format zugänglich gemacht, manchmal auch als reine Text-Datei mit den Extensionen .TXT, .DAT, .TAB oder .CSV [5]. Diese Datensätze müssen mit der Programmkomponente PRELIS zunächst in das .LSF-Format umgewandelt werden [6]. Dabei ist zu beachten, dass PRELIS numerische Variablen mit weniger als 15 verschiedenen Ausprägungen standardmäßig als ordinalskaliert betrachtet und weiteren Hinweis transformiert. Ist dies nicht gewünscht, muss an dieser Stelle manuell

1 Data:

2 File is ess w1 cfa raw . dat ;

3 Variable:

4 Names are

5 imtcjob imbleco imueclt imwbcnt ;

6 Missing are all ( -9999) ;

7 Model:

8 OEK BY imtcjob * imbleco ;

9 OEK@1 ;

10 CULT BY imueclt * imwbcnt ;

11 CULT@1 ;

Listing 3.3 CFA in Mplus

eingegriffen werden. Bei der Erzeugung der Beispieldatensätze wurde dieser Mechanismus deaktiviert, um die Ergebnisse der Programme vergleichbar zu halten.

Anders als in Stata müssen in LISREL die latenten Variablen explizit definiert werden. Dies geschieht in Zeile 2. Das Schlüsselwort Relationships in Zeile 3 markiert dann den Beginn eines Blocks, der analog zu Zeile 5/6 in Listing 3.1 die Gleichungen des Messmodells enthält. Anders als in Stata steht jede Gleichung in einer eigenen Zeile. Wie oben bereits angesprochen ist es außerdem notwendig, den Achsenabschnitt mit dem Schlüsselwort CONSTANT explizit in die Gleichungen aufzunehmen. Die Metrik der latenten Variablen muss hingegen nicht explizit auf einen Mittelwert von 0 und eine Varianz von 1 festgelegt werden, da dies der Voreinstellung entspricht. Auch die Kovarianz bzw. Korrelation zwischen den Faktoren wird automatisch geschätzt. Die Schlüsselworte End of Problem markieren das Ende der Eingabe.

Auch in Mplus lässt sich die CFA mit wenigen Zeilen definieren, wie Listing 3.3 zeigt. Mplus-Eingabeskripte bestehen aus mehreren Blöcken, die jeweils mit einem Schlüsselwort beginnen, auf das ein Doppelpunkt folgt. Innerhalb der Blöcke stehen dann einzelne Anweisungen, die jeweils mit einem ; beendet werden.

Im ersten dieser Blöcke wird die Datenquelle benannt. Mplus akzeptiert nur Daten im Textformat. Rekodierungen und Transformationen sollten in einem anderen Statistikpaket vorgenommen werden. In Stata ist es mit Hilfe des benutzerdefinierten Kommandos stata2mplus [7] leicht möglich, die benötigten Variablen auszuwählen und in einer für Mplus lesbaren Datei zu speichern. stata2mplus erzeugt außerdem ein Programmfragment, das die Daten in Mplus einliest und um die Anweisungen für die eigentliche Modellierung ergänzt werden kann.

Im zweiten Block (Zeile 3 bis 6) müssen die beobachteten Variablen deklariert werden, da die Textdatei mit den Messwerten keine Information über die Variablennamen oder die Interpretation bestimmter Werte als Indikator für missing values enthält. Im dritten Block (Zeile 7 bis 11) wird dann das Modell definiert.

Die Struktur der Syntax unterscheidet sich dabei geringfügig von den entsprechenden Codeblöcken in Stata bzw. LISREL/SIMPLIS [8]. Während dort die Indikatoren durch ihre Beziehung zu den Faktoren definiert wurden, stehen die Namen der Faktoren hier zu Beginn der Zeilen 8 bzw. 10, gefolgt von dem Schlüsselwort BY, das angibt, mit welchen Indikatoren die Faktoren gemessen werden.

Wichtig ist dabei der Stern, der an die Namen der jeweils ersten Indikatoren angehängt wird. Dieser bedeutet, dass der entsprechende Pfadkoeffizient frei geschätzt werden soll. Per Voreinstellung würden diese Pfadkoeffizienten ansonsten auf den Wert 1 gesetzt. In Kombination mit den Zeilen 9 und 11, in denen mit Hilfe des @-Zeichens die Varianz der Faktoren auf den Wert 1 gesetzt wird, wird so die Metrik der latenten Variablen definiert. Damit ist die Eingabe abgeschlossen.

  • [1] Eine einfache graphische Darstellung auf einem Blatt Papier oder einem Whiteboard sollte stets am Beginn des Modellierungsprozesses stehen, um sich Klarheit über die verwendeten Konstrukte, Indikatoren und deren Beziehungen zu verschaffen
  • [2] Diese Syntax ist bei näherer Betrachtung intuitiv: Der Wert wird an („at“) der gewünschten Stelle des Zahlenstrahls fixiert
  • [3] 3 Im Stata-Handbuch und der mit ereturn list verfügbaren Ausgabe gespeicherter Schätzungen und Maßzahlen wird diese Größe als „model degrees of freedom“ bezeichnet. Dies ist irreführend, weil damit in der Literatur normalerweise die für einen Modelltest verfügbaren Freiheitsgrade gemeint sind (vgl. die Ausführungen auf der nächsten Seite)
  • [4] Die Irrtumswahrscheinlichkeit (Wahrscheinlichkeit, diesen oder einen größeren χ 2-Wert zu erhalten, wenn es tatsächlich keinerlei Abweichungen zwischen Modell und Realität gibt) liegt in beiden Fällen unterhalb von 0.1 %
  • [5] Diese Extensionen geben einen Hinweis auf das zur Abtrennung der Variablenfelder verwendete Trennzeichen. Zumeist handelt es sich um einen Tabulator oder ein Komma. Um Kodierungsfehler zu vermeiden, empfiehlt es sich aber dringend, die mitgelieferte Dokumentation zu konsultieren und den Datensatz vor dem Einlesen mit Hilfe eines Editors oder Tabellenkalkulationsprogramms in Augenschein zu nehmen
  • [6] PRELIS liest Datensätze im SPSS-Format und einer Reihe von Textformaten direkt ein. Datensätze im Stata-Format müssen zuerst in Stata eingelesen und dann mit dem Kommando outsheet als Textdatei exportiert werden. Die Erweiterungsbibliothek foreign für die Statistikumgebung R liest und schreibt eine Vielzahl binärer Formate und kann deshalb als Brücke zwischen den verschiedenen Programmen dienen
  • [7] Mit ssc install stata2mplus kann das Kommando aus dem Internet installiert werden. Mit ssc install runmplus lässt sich ein weiterer benutzerdefinierter Befehl installieren, der das Zusammenspiel von Stata und Mplus noch stärker automatisiert
  • [8] Beide Programme lassen hier aber Variationen zu
 
<<   INHALT   >>

Related topics