Desktop-Version

Start arrow Politikwissenschaft arrow Freiwillige Arbeit in gemeinnützigen Vereinen

< Zurück   INHALT   Weiter >

7.3.2 Clusteranalytisches Verfahren

Im Folgenden wurde sich aufgrund der unbefriedigenden Ergebnisse der explorativen Faktoranalyse für die Berechnung von objektorientierten Clusteranalysen entschieden. Die Fragen, denen in der vorliegenden Arbeit nachgegangen wird, sind zum einen, wie sich Freiwillige unterschiedlicher Einrichtungen voneinander unterscheiden, und zum anderen, ob diese Unterschiede mit ähnlichem Antwortverhalten und Motivstrukturen innerhalb der Organisationen einhergehen.

Ziel der objektorientierten Clusteranalyse ist es, ähnliche Fälle anhand von Eigenschaften zu Gruppen zusammenzufassen (Bacher 1994, S. 1; Backhaus et al. 2008, S. 391; Herink und Petersen 2004, S. 290; Schendera 2008, S. 8). Dabei sollen sich die Fälle innerhalb der Gruppen in den beobachteten Merkmalen möglichst ähnlich sein und sich zwischen den Gruppen möglichst unterscheiden. Dabei werden alle einbezogenen Merkmale und alle Fälle gleichzeitig für die Gruppenbildung berücksichtigt. In der vorliegenden Analyse wird untersucht, ob sich die Freiwilligen hinsichtlich ihrer Motive freiwilliger Arbeit in verschiede-nen Gruppen bzw. Clustern wiederfinden lassen und unterschiedliche Motivstrukturen aufgedeckt werden können (Schendera 2008, S. 12).

Die offenen Fragen nach den Motiven freiwilliger Arbeit haben eine Fülle von Daten geliefert, die in ihrer Gesamtheit unübersichtlich sind. Im Folgenden sollen diese Daten durch eine Clusteranalyse systematisch geordnet und auswertbar gemacht werden (ebd.). So kann die Komplexität der erhobenen Daten reduziert und in eine strukturierte Ordnung gebracht werden, um die „dahinterliegenden Sinnzusammenhänge theoretisch zu erklären“ (Emmrich 2010, S. 45; Friedrichs 1990, S. 90; Kluge 1999, S. 43). Daher wurde die Gruppierung in eine Theorie eingebettet und weitere Hypothesen über andere Zusammenhänge abgeleitet (Kapitel 6) (Friedrichs 1990, S. 90). Eine einleuchtende und empirisch sinnvolle Gruppierung der Fälle kann außerdem für fortführende Untersuchungen zur Stichprobenauswahl genutzt werden (Friedrichs 1990, S. 90). Die Elemente einer Gruppe sollen dabei intern homogen sein, also die größtmögliche Ähnlichkeit hinsichtlich ihrer Merkmale, im vorliegenden Fall der Motive, aufweisen (Ebene des Typus). Die Zugehörigkeit eines Freiwilligen zu einer Gruppe gibt damit vielfältige Informationen über verschiedene Merkmale, die er mit großer Wahrscheinlichkeit sein Eigen nennt, ohne dass diese Informationen im Einzelfall vorliegen müssen (Kluge 1999, S. 44). Die einzelnen Gruppen jedoch sollten extern heterogen sein, also zwischen den Gruppen sollten die größtmöglichen Unterschiede bestehen (Typologie) (Kluge 1999, S. 44).

Um heuristische Aussagen zu treffen, reicht eine bloße empirische Typenbildung auf Grundlange quantitativer Daten nach Meinung vieler Autoren nicht aus (Adorno 2007, S. 309; Emmrich 2010, S. 45; Friedrichs 1990, S. 90; Kluge 1999, S. 47). Zwar werden statistische Zusammenhänge aufgezeigt, die dahinter stehenden „Sinnzusammenhänge“ bleiben jedoch verborgen. Qualitative Arbeiten können dagegen detailgenauer analysieren, jedoch mangelt es diesen oft an einer ausreichenden Stichprobengröße, um auf die Allgemeinheit zu schließen. Als optimal wird eine Kombination aus qualitativer und quantitativer Forschung beschrieben (ebd.). In der vorliegenden Arbeit handelt es sich um eine quantitative Untersuchung. Die Fragen nach den Motiven sind jedoch offen erhoben, was sicher nicht als optimal, jedoch einer rein standardisierten Abfrage von vorgegebenen Antwortitems als deutlich überlegen zu bezeichnen ist.

Um einen heuristischen Wert einer Gruppenbildung zu erlangen, werden im Folgenden zunächst deskriptive Ergebnisse der Untersuchung gezeigt und anschließend die Clusteranalyse. Weiterhin soll die Analyse „nicht bei der Ermittlung der jeweiligen Merkmalskombinationen der Typen stehen[bleiben], sondern (…) die Korrelationen und Sinnzusammenhänge, die sich in der Regel hinter den ermittelten Merkmalskombinationen verbergen, [sollen] analysiert werden“ (Kluge 1999, S. 49). Im Folgenden soll die Typenbildung (bzw. Gruppenbildung) erfolgen, wie sie McKinney (McKinney 1966, S. 25) vorschlägt und aus Webers (1991 [1904], S. 73) Idealtyp entwickelt hat (Kluge 1999, S. 56). Er verneint die Ideal- und Realtypen und entwickelt sogenannte konstruierte Typen, die sich aus verschiedenen „theoretischen und empirischen Anteilen“ zusammensetzen (ebd., S. 56). Die Zugehörigkeit zu den Typen (hier Gruppen) ist weniger normativ als der Idealtyp von Weber (1991 [1904], S. 73). Der Vorteil der konstruierten Typen gegenüber Webers Idealtypen besteht in der besseren Abbildung der Realität. Idealtypen dagegen sind unwirklich und dienen lediglich der Analyse hypothetischer Konstrukte (ebd.).

Die Antworten auf die offenen Fragen nach den Motiven wurden quantifiziert, indem alle Aussagen in dichotome Variablen überführt wurden. Anders als für die Strukturgleichungsmodellierung ist kein höheres Skalenniveau notwendig, daher wurden zwar ebenfalls die jeweils acht meistgenannten Motive der drei Fragen verwendet, die Häufigkeit der Nennung aber außer Acht gelassen.

Eine quantitative Codierung offener Fragen führt zu einer Reduktion komplexen Datenmaterials in überschaubare und übersichtlichere Items und ermöglicht quantitative Analysen, aber auch zu einem enormen Verlust von Informationen (Emmrich 2010, S. 44; Kluge 1999, S. 210). Um keine reliable Variablen zu erhalten, muss die Quantifizierung mit äußerster Sorgfalt durchgeführt werden (ebd.). Die Aussagen wurden zunächst – wie in Kapitel 7.3.1 beschrieben – durch zwei studentische Mitarbeiter verkodet. Anschließend wurden die Aussagen erneut von der Autorin der vorliegenden Arbeit verkodet und mit den ersten beiden Verkodungen abgeglichen. Diese quantifizierten Aussagen dienen im Folgenden als Basis für die Clusterbildung. Da bisher keine allgemeingültige Theorie von Motivtypen in unterschiedlichen Einrichtungen in der Literatur zu finden ist, muss sich die Typologie auf die Antwortmuster stützen. In Kapitel 6.3 wurden die theoretischen Überlegungen zu den Motivstrukturen der Freiwilligen verschiedener Organisationen dargestellt und im Folgenden mit den „tatsächlichen Antwortmuster(n) (…) abgeglichen“ (Emmrich 2010, S. 458). In Kapitel 8.6.4 werden die Ergebnisse der Clusteranalyse dargestellt. Im Anschluss daran wird eine kausalanalytische Betrachtung mit der Clusterbzw. Motivgruppenzugehörigkeit als abhängige Variable vorgenommen (Kapitel 8.7).

Zunächst wird das Single-Linkage-Verfahren angewendet. Anfangs bildet jedes Objekt ein eigenes Cluster. Das Verfahren ermittelt alle Abstände zwischen allen Objekten und fasst die nächstgelegensten Objekte zusammen. Anschließend wird der Abstand zwischen diesen ersten Clustern und den anderen Clustern erneut gemessen und jene mit den geringsten Abständen wieder zusammengefasst, so dass immer weniger Cluster mit immer mehr Objekten entstehen.

Dieses Verfahren eignet sich besonders dazu, Ausreißer zu identifizieren, weil es die Fälle nach und nach aufnimmt und den Clustern zuordnet. In jedem Schritt wird die Anzahl der Cluster um genau ein Cluster geringer und endet in N 1 Schritten. (Backhaus et al. 2008, S. 414; Schendera 2008, S. 23). Dabei bildet D die Distanz zwischen einem Objekt R und einem neuen Cluster aus den Objekten P und Q[1] (Backhaus et al. 2008, S. 415 f.). Fälle, die ganz am Ende des Verfahrens aufgenommen werden, sind sehr untypisch und weisen erhebliche Distanzen zu den anderen Fällen auf.

Vorher müssen aber die Übereinstimmungsoder auch Proximitätsmaße für die Motive berechnet werden (Backhaus et al. 2008, S. 392). Proximitätsmaße unterscheiden sich u.a. danach, ob sie die Distanz oder die Ähnlichkeit der Objekte messen und ob nur das Vorhandensein oder auch das nicht Vorhandensein eines Merkmals berücksichtig wird (Backhaus et al. 2008, S. 394; Schendera 2008, S. 3). Da die Relevanz von Motiven wie auch die Irrelevanz von Motiven in der vorliegenden Analyse für die Freiwilligen von Bedeutung ist, muss ein Verfahren gewählt werden, das auch das Fehlen bestimmter Motive interpretierbar macht. Für binäre Merkmalsvariablen, wie die vorliegenden Motive, liegen verschiedene Proximitätsmaße vor. Im Folgenden wird die binäre Euklidische Distanz d verwendet[2], die die Quadratwurzel aus ungleichen Wertpaaren zieht (Backhaus et al. 2008, S. 401; Brosius 2013, S. 738). Tabelle 14 zeigt beispielhaft die Kombinationsmöglichkeiten der Motive für zwei Fälle, die der Berechnung der binären euklidischen Distanz zugrunde liegen.

Die Identifikation der Ausreißer wird anhand von als Stringvariablen codierten Fallnummern vorgenommen, die als Identifikationsnummer aufgenommen und anschließend in einem Dendogramm ausgegeben werden. Das Dendogramm der vorgenommen ersten Clusteranalyse mit dem Single-Linkage-Verfahren zeigt an, wann ein Fall mit einem anderen Fall zusammengefügt wurde und wie groß der Abstand zwischen den Fällen ist. Der Abstand ist normiert und kann Werte zwischen 0 und 25 erreichen.

Anschließend wird eine erneute Clusteranalyse durchgeführt. Dabei wird das Ward-Verfahren angewendet. Zwar ist das Ward-Verfahren ursprünglich für metrische Merkmale konzipiert, kann aber nach u.a. Meyer (2011), Brosius (2013), Backhaus und Kollegen (2008, S. 424; Bergs 1981, S. 96 f.) und Schendera (Schendera 2008, S. 13) auch für dichotome Merkmale verwendet werden, sofern das Proximitätsmaß dem Skalenniveau angepasst ist.

Tabelle 14: Vierfeldertafel für Kombinationsmöglichkeiten der dichotomen Motive

Quelle: Backhaus et al. (2008, S. 396), veränderte Darstellung, a = Anzahl der Motive, die in beiden Fällen vorliegen (1;1), b = Anzahl der Motive, die in Fall 1 nicht vorliegen und in Fall 2 vorliegen (0;1), c = Anzahl der Motive, die in Fall 1 vorliegen und die in Fall 2 nicht vorliegen (1;0), d = Anzahl der Motive, die bei beiden Fällen nicht vorliegen (0,0).

Vektoren der Dimension d, die nur Nullen und Einsen beinhalten, können ohne weiteres als Elemente des Rd aufgefasst werden. Die betrachteten Vektoren lassen sich isometrisch in den euklidischen Rd einbetten (ebd.).

Das Ward-Verfahren fügt die Objekte zu Clustern zusammen, die ein bestimmtes Heterogenitätsmaß nur minimal vergrößern. Dieses Heterogenitätsmaß[3] bildet das Varianzkriterium oder auch Fehlerquadratsumme Vg (Backhaus et al. 2008, S. 420). Da zunächst jedes Objekt ein eigenes Cluster bildet, ist das Varianzkriterium anfangs Vg = 0. Nach und nach werden die Variablen mit der geringsten Erhöhung des Varianzkriteriums vereinigt. So wird die Streuung innerhalb der Gruppen möglichst klein gehalten[4] (Backhaus et al. 2008, S. 420).

Um die Auswahl der besten Clusterlösung zu unterstützen, wird der MojenaKoeffizient herangezogen (Backhaus et al. 2008, S. 432 f.; Bacher 1994, S. 249; Mojena 1977, S. 359 f.). Dabei wird überprüft, bei welchem Fusionsschritt n der standardisierte Fusionskoeffizient a-i von einer Normalverteilung abweicht. Es wird davon ausgegangen, dass die Werte zwischen a-i = 2,75 bis a-i = 3,5 mit einem Signifikanzniveau von 99,7 % von der Normalverteilung abweichen und sich hier die optimale Clusterlösung befindet. Im Folgenden wird das methodische Vorgehen Güteprüfung der clusterbildenden Variablen vorgestellt.

  • [1] D (R;P + Q) = A * D (R,P) + B * D (R,Q) + E*D (P,Q)+ G* | D (R,P) – (R,Q) |mit D (R;P) = Distanz zwischen den Gruppen R und P; D (R;Q) = Distanz zwischen den Gruppen R und Q und mit D (P;Q) = Distanz zwischen den Gruppen P und Q (Backhaus et al. 2008, S. 415 f.).
  • [2] d = v'b+ c Weitere gängige Proximitätsmaße für binäre Daten stellen u.a. Backhaus et al. (2008, S. 395) und Brosius (2013, S. 738) dar
  • [3] Vg = .L .Lj=1(xkjgxjg) mit x-jg = Mittelwert über die Beobachtungswerte der Variablen j in der Gruppe g und xkjg = Beobachtungswert der Variablen j (j=1,…, J) bei Objekt k (für alle k=1,…, Kg in Gruppe g)
  • [4] Auf die Darstellung der Distanzmatrix der 557 Fälle wird aufgrund ihres großen Umfangs verzichtet
 
< Zurück   INHALT   Weiter >

Related topics