Dokument_1.pdf (3044 KB) - OPUS Augsburg - Universität Augsburg

Dokument_1.pdf (3044 KB) - OPUS Augsburg - Universität Augsburg Dokument_1.pdf (3044 KB) - OPUS Augsburg - Universität Augsburg

opus.bibliothek.uni.augsburg.de
von opus.bibliothek.uni.augsburg.de Mehr von diesem Publisher
14.03.2013 Aufrufe

(Fälle) bestehen und die Daten müssen positiv und ganzzahlig sein (vgl. Meulman/Heiser 2004, S. 2, 81, 77; Greenacre 1994, S. vii). Das Verfahren entspricht damit einer bestimmten „Philosophie“ der Datenanalyse, nach der sich die Analysemethoden den Daten anzupassen haben und nicht umgekehrt (vgl. Greenacre 1994, S. viii). 26 Die theoretischen Positionen der soziologischen Klassiker stellen keine Mengenangaben (Quantitäten), sondern Eigenschaften (Qualitäten) dar. Die Daten haben dementsprechend nominales, bestenfalls ordinales Skalenniveau. Die Größe des Objektbereichs ist mit ca. 15 relativ gering. Die Korrespondenzanalyse ist der Faktorenanalyse sehr ähnlich. Letztere ermöglicht die Skalierung von multivariaten Daten 27 , die Entdeckung von untereinander unabhängigen Beschreibungs- und Erklärungsvariablen und leistet einen wesentlichen Beitrag zur Datenreduktion. Sie dient damit der Vereinfachung komplexer Sachverhalte. Für die Faktorenanalyse kommen nur metrische Daten infrage, bei der Korrespondenzanalyse können hingegen nominale Daten untersucht werden (vgl. Bacher 2002, S. 27, 32; Backhaus et al. 2003, S. 260, 677). Aufgrund der geringen Anforderungen an das Skalenniveau ist die Korrespondenzanalyse grundsätzlich für sämtliche Daten anwendbar (vgl. Bacher 2002, S. 28). Die Analysemethode erlaubt darüber hinaus eine räumliche Darstellung der Objekte und Variablen bzw. Kategorien in einem niedrigdimensionalen Raum („Korrespondenzraum“). Sie dient der Vereinfachung und Veranschaulichung komplexer Sachverhalte (vgl. Backhaus et al. 2003, S. 674). Die Visualisierung der Daten würde hier unter Umständen die Erstellung von „wissenschaftlichen Landkarten“ ermöglichen, die die Affinitäten zwischen theoretischen Positionen oder den Klassikern darstellen. Für die Anwendung der Korrespondenzanalyse gilt, wie auch für die Faktorenanalyse, dass die Güte der Ergebnisse der Analyse von der Zuverlässigkeit der Ausgangsdaten, der Relevanz der erhobenen Merkmale für den Untersuchungsgegenstand und der Homogenität der Stichprobe abhängig ist (vgl. Backhaus et al. 2003, S. 269). Auf diesen Aspekt wird speziell unter 3.4 auf S. 75 eingegangen. Einfache Korrespondenzanalyse Die Aufgabe der einfachen Korrespondenzanalyse ist die Beschreibung und die grafische Darstellung der Beziehung zweier Gruppen von qualitativen Merkmalen in einem flachdimensionierten Raum. Diese qualitativen Merkmale sind die Merkmalskategorien der Variablen. 26 Diese „Philosophie“ geht auf einen Begründer der Korrespondenzanalyse zurück: Jean-Paul Benzécri. 27 „Skalierung“ bedeutet, den Kategorien einer Variablen numerische Quantifizierungen zuzuordnen. Dadurch können Standardprozeduren verwendet werden, um eine Lösung für die quantifizierende Variable zu erhalten (vgl. Meulman/Heiser 2004, S. 1). 43

Für jede Variable werden die Beziehungen zwischen den Kategorien durch die Distanzen (euklidische oder Chi-Quadrat-Distanzen) zwischen den Kategoriepunkten in einem Diagramm dargestellt. (vgl. Meulman/Heiser 2004, S. 65). Die einfache Korrespondenzanalyse (CA) erfolgt – vereinfacht dargestellt - in vier Schritten: 1. Schritt: Erstellung einer Kontingenztabelle Die Analyse beginnt mit der Erstellung einer Kontingenztabelle 28 , die die Zeilen- und Spaltenprofile der kategorialen Gruppen ausgibt, d.h. die jeweiligen Häufigkeiten in Relation zur Zeilen- bzw. Spaltensumme. Für das Verfahren ist es dabei unerheblich, welche Gruppe die Zeilen und die Spalten abbildet. Auf der Basis dieser Tabelle kann der Chi-Quadrat-Test durchgeführt werden. Dieser Test prüft, ob die Ausprägungen der Kategorien zufällig in der Stichprobe auftreten. Er hat damit eine inferenzstatistische Bedeutung. Die Daten werden auf statistische Unabhängigkeit geprüft unter der Nullhypothese: „Die Zeilen- und Spaltenvariablen sind unabhängig voneinander“. Dazu wird die Summe der erwarteten Werte - unter der Prämisse der Unabhängigkeit - mit der Summe der empirisch beobachteten Werte verglichen. Eine große Differenz zwischen den Werten führt zur Verwerfung der Null-Hypothese, der Zusammenhang zwischen den Variablen bzw. Kategorien ist damit signifikant. Der Chi- Quadrat-Wert (χ²) ist dann dementsprechend hoch (vgl. Backhaus et al. 2003, S. 683ff.). Der Chi-Quadrat-Test ist abhängig von der Größe der Fallzahl in der Stichprobe. Es wird aus die- sem Grund die so genannte „Totale Inertia“ (T) berechnet: T = χ²/n (vgl. ebd.). 2. Schritt: Standardisierung der Daten Die Kontingenztabelle wird in eine „Korrespondenztabelle“ umgewandelt, die fallzahlunabhängig ist. Es werden die absoluten Häufigkeiten durch die Gesamthäufigkeit n dividiert. Es ergeben sich dadurch relative Werten („proportions“). Die Randsummen der Zeilen bzw. Spalten ergeben dann jeweils die „Massen“ der Zeilen (pi.) bzw. Spalten (p.j). Im Anschluss erfolgt die „Zentrierung“: Hier werden die „Zentroide“ (= die Durchschnittsprofile der Zeilen bzw. Spalten) im Koordinatenursprung (Koordinate 0/0) des Korrespondenzraums ausgerichtet. Die Korrespondenztabelle erhält dementsprechend standardisierte Werte (z) (vgl. ebd.; Grennacre 1994, S. 12). 28 Die Grundlage kann auch eine Kreuztabelle darstellen. 44

(Fälle) bestehen und die Daten müssen positiv und ganzzahlig sein (vgl. Meulman/Heiser<br />

2004, S. 2, 81, 77; Greenacre 1994, S. vii). Das Verfahren entspricht damit einer bestimmten<br />

„Philosophie“ der Datenanalyse, nach der sich die Analysemethoden den Daten anzupassen<br />

haben und nicht umgekehrt (vgl. Greenacre 1994, S. viii). 26 Die theoretischen Positionen der<br />

soziologischen Klassiker stellen keine Mengenangaben (Quantitäten), sondern Eigenschaften<br />

(Qualitäten) dar. Die Daten haben dementsprechend nominales, bestenfalls ordinales Skalenniveau.<br />

Die Größe des Objektbereichs ist mit ca. 15 relativ gering.<br />

Die Korrespondenzanalyse ist der Faktorenanalyse sehr ähnlich. Letztere ermöglicht die<br />

Skalierung von multivariaten Daten 27 , die Entdeckung von untereinander unabhängigen<br />

Beschreibungs- und Erklärungsvariablen und leistet einen wesentlichen Beitrag zur Datenreduktion.<br />

Sie dient damit der Vereinfachung komplexer Sachverhalte. Für die Faktorenanalyse<br />

kommen nur metrische Daten infrage, bei der Korrespondenzanalyse können hingegen nominale<br />

Daten untersucht werden (vgl. Bacher 2002, S. 27, 32; Backhaus et al. 2003, S. 260,<br />

677). Aufgrund der geringen Anforderungen an das Skalenniveau ist die Korrespondenzanalyse<br />

grundsätzlich für sämtliche Daten anwendbar (vgl. Bacher 2002, S. 28).<br />

Die Analysemethode erlaubt darüber hinaus eine räumliche Darstellung der Objekte und<br />

Variablen bzw. Kategorien in einem niedrigdimensionalen Raum („Korrespondenzraum“).<br />

Sie dient der Vereinfachung und Veranschaulichung komplexer Sachverhalte (vgl. Backhaus<br />

et al. 2003, S. 674). Die Visualisierung der Daten würde hier unter Umständen die Erstellung<br />

von „wissenschaftlichen Landkarten“ ermöglichen, die die Affinitäten zwischen theoretischen<br />

Positionen oder den Klassikern darstellen.<br />

Für die Anwendung der Korrespondenzanalyse gilt, wie auch für die Faktorenanalyse, dass<br />

die Güte der Ergebnisse der Analyse von der Zuverlässigkeit der Ausgangsdaten, der Relevanz<br />

der erhobenen Merkmale für den Untersuchungsgegenstand und der Homogenität der<br />

Stichprobe abhängig ist (vgl. Backhaus et al. 2003, S. 269). Auf diesen Aspekt wird speziell<br />

unter 3.4 auf S. 75 eingegangen.<br />

Einfache Korrespondenzanalyse<br />

Die Aufgabe der einfachen Korrespondenzanalyse ist die Beschreibung und die grafische<br />

Darstellung der Beziehung zweier Gruppen von qualitativen Merkmalen in einem flachdimensionierten<br />

Raum. Diese qualitativen Merkmale sind die Merkmalskategorien der Variablen.<br />

26 Diese „Philosophie“ geht auf einen Begründer der Korrespondenzanalyse zurück: Jean-Paul Benzécri.<br />

27 „Skalierung“ bedeutet, den Kategorien einer Variablen numerische Quantifizierungen zuzuordnen. Dadurch<br />

können Standardprozeduren verwendet werden, um eine Lösung für die quantifizierende Variable zu erhalten<br />

(vgl. Meulman/Heiser 2004, S. 1).<br />

43

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!