Start Medien und Kommunikationswissenschaft
Kommunikationsmanagement von Clusterorganisationen
|
|
|||||
5.7 DatenauswertungDie Statistik als Instrument der sozialwissenschaftlichen Forschung lässt sich in die deskriptive oder beschreibende Statistik und in die schließende bzw. Inferenz-Statistik unterteilen (vgl. Benninghaus 2005: 15ff.). Im Rahmen der Inferenz-Statistik wird aus einer definierten Grundgesamtheit eine Zufallsstichprobe gezogen, die untersucht wird. Aus den Ergebnissen dieser Stichprobe wird im Anschluss auf die Verteilung eines oder mehrerer Merkmale in der zugrunde liegenden Grundgesamtheit geschlossen. Die Inferenzstatistik kommt dann zum Einsatz, wenn Aussagen über sehr große Grundgesamtheiten gemacht werden. Bei deskriptiven Untersuchungen kleiner Grundgesamtheiten ist die Stichprobe hingegen kein adäquates Mittel (vgl. Schnell et al. 2011: 263). Durch die vergleichsweise kleine Grundgesamtheit dieser Untersuchung – in Europa existieren insgesamt nur wenig mehr als 1.000 Clusterorganisationen (vgl. European Cluster Observatory 2010) – ist für die hier verfolgte Forschungsfrage die Inferenzstatistik nur eingeschränkt relevant. Eine Stichprobe ist zudem nur dann ein Mittel der schließenden Statistik, wenn sie zufällig erfolgt und alle Fälle im Objektbereich die gleiche Chance haben, Teil der Stichprobe zu werden (vgl. Schnell et al. 2011: 265). In dieser Arbeit soll hingegen für einen abgrenzbaren Ausschnitt aus der Grundgesamtheit eine Vollerhebung durchgeführt werden. Diese bilden damit die eigentliche Grundgesamtheit dieser Untersuchung. In dem Sinne ist es nicht Ziel dieser Arbeit, auf darüber hinaus gehende Clusterorganisationen zu schließen – z. B. Clusterorganisationen in anderen Branchen oder von außerhalb der Europäischen Union (mit Ausnahme der Schweiz und Norwegen). Es sollen also keine repräsentativen Aussagen über das Kommunikationsmanagement in Clusterorganisationen generell getroffen werden. Die Untersuchung ist deskriptiv und analytisch angelegt und hat das Ziel, eine abgrenzbare Population in ihren Merkmalen zu beschreiben, eine Aussage über die untersuchten Einheiten hinaus ist hier nicht angestrebt. Dennoch sollen basierend auf der eingehenden Analyse einer Teilpopulation des Organisationstyps Clusterorganisation Hypothesen und Modelle entwickelt werden, die in zukünftigen, breiteren Untersuchungen mit Zufallsstichproben überprüft und erweitert werden können. Damit sind für die hier verfolgte Forschungsfrage die Ansätze der deskriptiven Statistik relevant (vgl. Benninghaus 2007). Diese Form der Statistik befasst sich mit der Beschreibung von erhobenen Merkmalsverteilungen in einer bestimmten Menge von Objekten. Mit ihrem Vokabular lassen sich wesentliche Informationen vermitteln, jedoch können sich „die Interpretationen der Ergebnisse einer deskriptiv statistischen Analyse (...) prinzipiell nur auf die jeweils betrachteten Untersuchungseinheiten beziehen“ (Benninghaus 2007: 15). Neben einer deskriptiven Beschreibung der Ergebnisse der standardisierten Umfrage wird in der Analyse insbesondere auf statistisch signifikante Zusammenhänge zwischen den Determinanten bzw. Rahmenbedingungen von Clusterorganisationen (unabhängige Variablen) und den Ausprägungen des Kommunikationsmanagements von Clusterorganisationen geachtet. Insgesamt soll die Kommunikation von Clusterorganisationen auf 14 verschiedene Determinanten hin überprüft werden, inwieweit sich statistische Zusammenhänge zwischen unabhängiger und abhängiger Variable ergeben. Zur Identifikation von statistischen Zusammenhängen werden in der empirischen Sozialforschung Assoziationsmaße eingesetzt, die Auskunft über die Stärke und gegebenenfalls die Richtung des Zusammenhangs geben. Entscheidend für die Auswahl eines geeignetes Assoziationsmaßes ist dabei die Frage, welches Skalenniveau die beiden untersuchten Variablen haben, ob sie also nominal-, ordinaloder intervallskaliert sind (vgl. Benninghaus 2007: 22f). Nominalskalierte Variablen bestehen dabei aus Kategorien von Antwortmöglichkeiten, die rangmäßig nicht geordnet sind (Beispiel: Geschlecht). „Für Nominalskalen ist konstitutiv, daß (sic!) die Kategorien vollständig sind (d.h. alle Fälle einschließen) und sich gegenseitig ausschließen (d.h. kein Fall darf in mehr als eine Kategorie gelangen)“ (Benninghaus 2007: 22). Ordinalskalierte Variablen bestehen hingegen aus einer Rangfolge, die jedoch nichts aussagt über die Größe der Differenz zwischen beiden Kategorien. Bei intervallskalierten Variablen schließlich herrscht ebenfalls eine genaue Kenntnis des genauen Abstandes zwischen den einzelnen Werten (Beispiel: Temperatur, Entfernungen oder Geldbeträge). Über das Skalenniveau entscheidet sich, welche mathematischen Operationen mit den Variablen möglich sind (vgl. Benninghaus 2007: 22ff.; Rasch et al. 2010: 8; Kuckartz et al. 2010: 202) – also sowohl welche statistischen Kennwerte (z.B. Modalwert, Median, Mittelwert) berechnet werden können als auch welche Assoziationsmaße für die Prüfung von Zusammenhängen zwischen verschiedenen Variablen eingesetzt werden können. Für nominalskalierte Variablen, wie sie in der hier vorgenommenen Untersuchung weitgehend verwendet werden, ist nur der Modalwert als statistischer Kennwert möglich, d.h. die Identifizierung der Antwort mit den meisten Nennungen. Ab Ordinalskalenniveau ist zusätzlich noch der Median möglich, ab Intervallskalenniveau der Mittelwert mit Standardabweichungen und Varianz (vgl. vgl. Rasch et al. 2010: 18). Eine Anwendung von linearer Korrelationsund Regressionsrechnung ist erst ab Intervallskalenniveau möglich (vgl. Raithel 2008: 137), kommt also hier nicht zum Einsatz. Das Skalenniveau bestimmt die verwendbaren Assoziationsmaße bei der Prüfung des Zusammenhangs zwischen zwei Variablen: Grundsätzlich gilt, dass das Assoziationsmaß durch das jeweils niedrigste Skalenniveau entschieden wird. Werden etwa eine nominalskalierte und eine ordinalskalierte Variable auf ihren Zusammenhang geprüft, muss dabei dennoch ein Assoziationsmaß für nominalskalierte Variablen zum Einsatz kommen (vgl. Benninghaus 2007: 27). Dies führt dazu, dass das Testen von Zusammenhängen zwischen abhängigen und unabhängigen Variablen im Rahmen dieser Arbeit fast ausschließlich mit Zusammenhangsmaßen durchgeführt werden muss, die für nominalskalierte Variablen geeignet sind, da fast ausschließlich immer mindestens eine der Variablen ein nominales Skalenniveau hat. Nur in wenigen Fällen kommt es vor, dass beide Variablen ein Ordinalskalenniveau haben, in diesen Fällen wurde der Rangkorrelationskoeffizient Spearman's Rho geprüft, der für beliebige Zusammenhänge von ordinalskalierten Variablen einsetzbar ist (vgl. Kuckartz 2010: 199). Für die Prüfung von Zusammenhängen zwischen nominalskalierten Variablen werden besonders Assoziationsmaße auf der Basis von Chi-Quadrat eingesetzt (vgl. Benninghaus 2007: 104; Kuckartz et al. 2010: 99). Chi-Quadrat drückt aus, ob ein gefundener Unterschied mit großer Wahrscheinlichkeit nicht zufällig ist (vgl. Benninghaus 2007: 104). Die Variablen werden in einer Kreuztabelle gegenübergestellt und die Quadrate der Differenzen zwischen beobachteten und erwarteten Häufigkeiten durch die erwarteten Werte geteilt (vgl. Schnell et al. 2011: 439; Kuckartz 2010: 88). Dadurch ergibt sich eine einzige Maßzahl, mit der die Abweichung zwischen der erwarteten und der beobachteten Häufigkeit ausgedrückt werden kann. Die Formel für die Berechnung von Chi-Quadrat lautet: Es gibt dabei jedoch eine Herausforderung zu bewältigen, die sich besonders durch kleine Stichproben und Variablen mit vielen Merkmalsausprägungen ergibt: Um valide zu sein, dürfen maximal 20 Prozent aller Zellen in einer Kreuztabelle eine erwartete Häufigkeit kleiner 5 aufweisen, um nicht das Verhältnis zwischen erwarteter und beobachteter Häufigkeit stark zu verzerren (vgl. Kuckartz 2010: 90). Um diesem Problem zu begegnen, werden in der Auswertung, wo immer sinnvoll möglich, Merkmalsausprägungen zusammengefasst und Variablen entsprechend neu berechnet, da sich dadurch die Häufigkeiten pro Zelle erhöhen. Dennoch bleiben Variablen übrig, wo dies nicht möglich ist, da sonst der damit einhergehende Informationsverlust zu groß wäre. In diesen Fällen werden zusätzliche exakte Signifikanztests durchgeführt, deren Ergebnisse zuverlässiger sind (vgl. Kuckartz 2010: 90). Mit Chi-Quadrat wird jedoch nur ausgedrückt, ob es einen Zusammenhang zwischen zwei Variablen gibt, jedoch ist damit noch keine Angabe über die Stärke des Zusammenhangs verbunden (vgl. Kuckartz 2010: 91). Dafür wird ein zusätzliches Zusammenhangsmaß benötigt. In der folgenden Analyse wird dabei der auf Chi-Quadrat basierende Koeffizient Cramer's V verwendet, da dieser sehr gut dafür geeignet ist, für r x c-Tabellen die Assoziation zwischen zwei Variablen mit einem Wert zu beschreiben, der die Abweichung von der statistischen Unabhängigkeit ausdrückt (vgl. Benninghaus 2007: 121). Cramer's V ist für Tabellen beliebiger Größe geeignet (vgl. Kuckartz 2010: 93). Cramer's V wird nach der folgenden Formel berechnet: In den Fällen, in denen ein signifikanter Zusammenhang zwischen zwei Variablen feststellbar ist, d.h. ein Chi-Quadrat Wert <0,05 und ein Wert von Cramer's V >0,2, wird zudem mithilfe der korrigiert standardisierten Residuen jeweils untersucht, welche Einzelwerte dabei herausstechen und in einem besonders starken signifikanten Zusammenhang stehen. Durch diese Prüfung anhand einzelner Zellenwerte lässt sich auch das Problem von erwarteten Häufigkeiten kleiner 5 abschwächen, indem individuell untersucht wird, welche Werte in einer Kreuztabelle dazu beitragen, dass der Chi-Quadrat-Wert auf einen Zusammenhang hindeutet. Als Maßregel gilt dabei, dass Einzelwerte, deren korrigiert standardisiertes Residual größer als 2,0 bzw. kleiner als -2,0 ist, auffallend nach oben oder unten abweichen (vgl. Haberman 1973, Agresti 1996). Um zu gewährleisten, dass die Untersuchung eine gute Chance hat, zu signifikanten Ergebnissen zu gelangen, ist eine hinreichend große Anzahl von ausgefüllten Fragebögen vonnöten. Die Rücklaufquoten bei empirischen Untersuchungen in der hier beschriebenen Art und mit diesem Umfang liegen in der Regel bei 15 bis 30 Prozent (vgl. Berekoven/Eckert/Ellenrieder 2004: 118). Dabei gilt jedoch, dass auch durch den Nachweis statistisch signifikanter Zusammenhänge zwischen den Variablen keine Erkenntnis über die Qualität oder die Kausalität des Zusammenhangs gewonnen ist: „Ein signifikantes Ergebnis ist nichts anderes als eine Entscheidungsgrundlage für die vorläufige Annahme der Forschungshypothese bzw. der geprüften Theorie“ (Bortz/Döring 2006: 27). Die empirischen Ergebnisse sind damit lediglich eine Basis für darauf aufbauende Interpretationen. |
<< | INHALT | >> |
---|
Related topics |