30.11.2012 Aufrufe

Der Portfolio-Ansatz in der Schülerbeurteilung der USA und seine ...

Der Portfolio-Ansatz in der Schülerbeurteilung der USA und seine ...

Der Portfolio-Ansatz in der Schülerbeurteilung der USA und seine ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

242<br />

wenn man davon ausgeht, dass e<strong>in</strong> Korrelationskoeffizient von 0.7 für summative<br />

<strong>Schülerbeurteilung</strong>en als M<strong>in</strong>imum betrachtet wird (Novak, Herman & Gearhart,<br />

1996, S. 12).<br />

Reliabilitätsstudien des American College Test<strong>in</strong>g (ACT)<br />

Im Rahmen ihres Projektes zur Entwicklung von nationalen <strong>Portfolio</strong>s <strong>in</strong> den Fächern<br />

Sprache, Mathematik <strong>und</strong> Naturwissenschaft erforschte das American College Test<strong>in</strong>g<br />

(ACT) auch die Reliabilität <strong>der</strong> Ergebnisse ihres <strong>Portfolio</strong>-<strong>Ansatz</strong>es. In e<strong>in</strong>er ersten<br />

Studie für das Schuljahr 1994−95 (Wolfe, 1996b) wurden jeweils über 400 <strong>Portfolio</strong>s<br />

pro Fach von zwei verschiedenen, fachlich qualifizierten <strong>und</strong> geschulten Korrektoren<br />

unabhängig vone<strong>in</strong>an<strong>der</strong> mit Hilfe e<strong>in</strong>er 6 Punkte-Skala bewertet. Zur Bestimmung <strong>der</strong><br />

Reliabilität wurden wie zuvor bei Novak, Herman <strong>und</strong> Gearhart (1996) die Korrektorenübere<strong>in</strong>stimmung<br />

<strong>in</strong> Prozent (<strong>in</strong>terrater reliability), die Korrelation zwischen den<br />

Ergebnissen <strong>der</strong> Korrektoren (correlations between raters) <strong>und</strong> die Verallgeme<strong>in</strong>erungskoeffizienten<br />

(generalizability coefficients) berechnet. Die Analysen von Wolfe<br />

(1996b, S. 7−14) führten zu folgenden Ergebnissen:<br />

• Für das Sprach-<strong>Portfolio</strong> reichte die Bandbreite für die perfekte Übere<strong>in</strong>stimmung<br />

<strong>der</strong> Korrektoren je nach Kategorie (work sample description; vgl. Abschnitt<br />

3.2.4.1.1) des <strong>Portfolio</strong>-E<strong>in</strong>trags von 34 % bis 61 %. Abweichungen von mehr als<br />

e<strong>in</strong>em Punkt waren selten (7 % bis 16 %), d.h. zu 80 % <strong>und</strong> mehr unterschieden<br />

sich die Bewertungen <strong>der</strong> Korrektoren um nicht mehr als 1 Punkt. Die Korrelationskoeffizienten<br />

bewegten sich zwischen 0.47 bis 0.79 je nach Kategorie des<br />

<strong>Portfolio</strong>-E<strong>in</strong>trags, was e<strong>in</strong>e durchschnittliche Interrater-Korrelation von 0.66 ergab.<br />

<strong>Der</strong> durchschnittliche Generalisierungskoeffizient lag bei e<strong>in</strong>em Wert von 0.73.<br />

• Für das Mathematik-<strong>Portfolio</strong> lag die perfekte Übere<strong>in</strong>stimmung <strong>der</strong> Korrektoren je<br />

nach Kategorie des <strong>Portfolio</strong>-E<strong>in</strong>trags zwischen 43 % bis 91 %. Abweichungen um<br />

mehr als e<strong>in</strong>en Punkt waren bis auf zwei Ausnahmen (17 % bzw. 20 % mehr als 1<br />

Punkt Unterschied) selten (0 % bis 12 %). Die Korrelationskoeffizienten reichten<br />

von 0.46 bis 0.96, was zu e<strong>in</strong>er durchschnittlichen Interrater-Korrelation von 0.62<br />

führte. <strong>Der</strong> durchschnittliche Generalisierungskoeffizient entsprach e<strong>in</strong>em Wert von<br />

0.33.<br />

• Für das Naturwissenschafts-<strong>Portfolio</strong> zeigte sich die perfekte Übere<strong>in</strong>stimmung<br />

zwischen den Korrektoren je nach Kategorie <strong>der</strong> <strong>Portfolio</strong>-Inhalte <strong>in</strong> 33 % bis 64 %<br />

aller Fälle. Unterschiede <strong>in</strong> <strong>der</strong> Bewertung um mehr als e<strong>in</strong>en Punkt waren selten<br />

<strong>und</strong> entsprachen 2 % bis 13 % <strong>der</strong> Fälle <strong>in</strong> e<strong>in</strong>er Inhaltskategorie. Überraschend<br />

fielen die Korrelationsberechnungen aus, wo die Interrater-Korrelation von -0.04<br />

bis zu 0.55 reichte, so dass e<strong>in</strong> Durchschnitt von 0.44 entstand. Als durchschnittlicher<br />

Generalisierungskoeffizient konnte e<strong>in</strong> Wert von 0.31 ermittelt werden.<br />

Wolfe (1996b, S. 15) kam aufgr<strong>und</strong> dieser Resultate zum Schluss, dass nur gerade die<br />

Reliabilitätswerte des Sprach-<strong>Portfolio</strong>s angemessen hoch ausgefallen seien, während<br />

sowohl für das <strong>Portfolio</strong> <strong>in</strong> <strong>der</strong> Mathematik <strong>und</strong> <strong>in</strong>sbeson<strong>der</strong>e für dasjenige <strong>in</strong> <strong>der</strong><br />

Naturwissenschaft die Werte nicht befriedigten. Die mangelnde Reliabilität <strong>der</strong> <strong>Portfolio</strong>-Ergebnisse<br />

führte Wolfe (1996b, S. 15−16) auf die Tatsache zurück, dass sich <strong>in</strong><br />

den Bewertungen <strong>der</strong> <strong>Portfolio</strong>s ke<strong>in</strong>e für die Reliabilitätsberechnungen brauchbare<br />

Streuung e<strong>in</strong>gestellt hatte. Er begründete dies erstens damit, dass die Bewertungs-

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!