14.12.2012 Aufrufe

Lehrstuhl für Mathematik und ihre Didaktik Walter Olbricht, Doris ...

Lehrstuhl für Mathematik und ihre Didaktik Walter Olbricht, Doris ...

Lehrstuhl für Mathematik und ihre Didaktik Walter Olbricht, Doris ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

50<br />

Die genaue Beschreibung ergibt sich aus folgender Datei:<br />

Regression tree:<br />

*** Tree Model ***<br />

snip.tree(tree = tree(formula = Gesamtmean ~ Geschlecht + Alter + Anzahlum +<br />

Noteum + Schulartkopie + Klassefak + Klassensatzfak, data =<br />

gepruefteEndtabelle27kurz, na.action = na.exclude, mincut = 3, minsize<br />

= 6, mindev = 0), nodes = c (12, 22, 23, 7, 4, 13, 10))<br />

Variables actually used in tree construction:<br />

[1] "Klassensatzfak" "Anzahlum" "Noteum" "Geschlecht"<br />

Number of terminal nodes: 7<br />

Residual mean deviance: 0.111 = 34.5 / 311<br />

Distribution of residuals:<br />

Min. 1st Qu. Median Mean 3rd Qu. Max.<br />

-0.987 -0.20 -0.00567 -2.17e-016 0.22 0.905<br />

node), split, n, deviance, yval<br />

* denotes terminal node<br />

1) root 318 53.00 2.0<br />

2) Klassensatzfak:1,3,5,6,7,9,14,15,17,20 199 19.00 1.8<br />

4) Klassensatzfak:1,3,6,20 77 4.00 1.7 *<br />

5) Klassensatzfak:5,7,9,14,15,17 122 13.00 1.9<br />

10) Klassensatzfak:5,7,14,15 80 6.50 1.9 *<br />

11) Klassensatzfak:9,17 42 6.10 2.0<br />

22) Anzahlum3.5 10 0.96 1.7 *<br />

3) Klassensatzfak:11,12,16,21,22 119 20.00 2.3<br />

6) Noteum2.5 92 16.00 2.3 *<br />

Abbildung 26 Output <strong>für</strong> den Regressionsbaum<br />

Die Graphiken sind weitgehend selbsterklärend. Man sieht, dass Klassensatz, Note, Geschlecht <strong>und</strong><br />

Anzahl als Kriterien fungieren, um einen Regressionsbaum <strong>für</strong> die Variable Gesamtmittel zu erstellen.<br />

Für einen Schüler mit Klassensatz = a (bzw. 1) wird als Gesamtmittel 1.7 vorhergesagt usw. Klassensatz<br />

= a in der Graphik steht dabei <strong>für</strong> Klassensatz = 1, da <strong>für</strong> faktorielle Variablen dort eine Buchstabenkodierung<br />

vorgenommen wird, um auch höhere Werte als 10 einstellig zu kodieren. Entsprechend<br />

bezeichnet Klassensatz aber den ersten, zweiten, fünften <strong>und</strong> fünfzehnten Ausprägungswert des Faktors<br />

Klassensatz, mithin die Klassensätze 1, 3, 6 <strong>und</strong> 20. In der Datei-Beschreibung des Regressionsbaumes<br />

ist aber die ursprüngliche Bezeichnung gewählt. Der gerade angesprochene Fall Klassensatz:<br />

abeo (bzw. 1, 3, 6, 20) findet sich dort unter „4“. Der damit bezeichnete Knoten ist ein Endknoten<br />

mit 77 Mitgliedern <strong>und</strong> einem Durchschnittswert von 1,7 <strong>für</strong> das Gesamtmittel. Bei der Addition der<br />

Endknotengrößen ergibt sich nur 318, weil Fälle mit fehlenden Werten in einer der Variablen ausgeschlossen<br />

werden müssen.<br />

Insgesamt ist der Baum <strong>und</strong> seine Knotenpunkte so gewählt worden, dass er die Daten möglichst<br />

genau <strong>und</strong> sparsam beschreibt. Als Vorteile hat man neben einer einfachen Beschreibung dann auch<br />

eine durchsichtige Darstellung der Struktur der Daten. Allerdings sind derartige Bäume im hohen Maße<br />

instabil, das heißt sie hängen stark von den gewählten Verfahren <strong>und</strong> Parametern <strong>für</strong> die zugr<strong>und</strong>e<br />

liegende Optimierung ab. Um nicht Artefakte zu produzieren, ist daher ein methodisch vorsichtiges<br />

Vorgehen gefordert. Im obigen Fall wurde ausgehend von den Variablen aus der Tabelle zunächst ein<br />

großer Baum erzeugt, der dann durch so genanntes „Pruning“ zurechtgestutzt wurde. Es ergab sich<br />

eine Sequenz von Bäumen mit zunehmender bzw. abnehmender Anzahl von Endknoten. Die so genannte<br />

„Deviance“ (als Maß <strong>für</strong> die Ungenauigkeit des Baumes) ist in folgender Graphik skizziert:

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!