Der Portfolio-Ansatz in der Schülerbeurteilung der USA und seine ...
Der Portfolio-Ansatz in der Schülerbeurteilung der USA und seine ...
Der Portfolio-Ansatz in der Schülerbeurteilung der USA und seine ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
40<br />
2.3.2.3.2 Gütekriterium Zuverlässigkeit (Reliabilität)<br />
Ausgangspunkt für die Konzeption des Gütekriteriums Zuverlässigkeit (Reliabilität) ist<br />
die Vorstellung (siehe z.B. AERA, APA & NCME, 1999, S. 25; Feldt & Brennan,<br />
1989, S. 105), dass idealerweise e<strong>in</strong>e wie<strong>der</strong>holt durchgeführte <strong>Schülerbeurteilung</strong><br />
sowohl für jeden e<strong>in</strong>zelnen Lerner als auch für die Gruppe <strong>der</strong> Lernenden stets zu denselben<br />
Ergebnissen führt. Denn nur dann ist sichergestellt, dass die Ergebnisse <strong>der</strong><br />
<strong>Schülerbeurteilung</strong> nicht e<strong>in</strong> Zufallsprodukt darstellen <strong>und</strong> dass deshalb den Interpretationen<br />
vertraut werden kann, die auf diesen Ergebnissen beruhen, <strong>und</strong> dass sie<br />
auch für verschiedene gleichartige Situationen wie auch für e<strong>in</strong>en bestimmten zeitlichen<br />
Horizont verallgeme<strong>in</strong>ert werden dürfen (siehe AERA, APA & NCME, 1999,<br />
S. 27). In <strong>der</strong> Realität zeigt sich aber, dass jede <strong>Schülerbeurteilung</strong> unabhängig von <strong>der</strong><br />
gewählten Erfassungsmethode bei wie<strong>der</strong>holter Durchführung zu Ergebnissen führt,<br />
die von Durchführung zu Durchführung mehr o<strong>der</strong> weniger stark vone<strong>in</strong>an<strong>der</strong> abweichen<br />
(AERA, APA & NCME, 1999, S. 25; Traub & Rowley, 1994, S. 171). Es ist<br />
deshalb nicht e<strong>in</strong>deutig feststellbar, welches <strong>der</strong> vorliegenden Ergebnisse das Richtige<br />
ist, also das Lernen bzw. den Lernfortschritt am besten wie<strong>der</strong>gibt. Dementsprechend<br />
entsteht e<strong>in</strong>e Unsicherheit, wie vertrauenswürdig die auf solchen Ergebnissen beruhenden<br />
Interpretationen tatsächlich s<strong>in</strong>d <strong>und</strong> wie weit sie auch verallgeme<strong>in</strong>ert werden<br />
dürfen. Diese Unsicherheit lässt sich jedoch um so mehr reduzieren, je ger<strong>in</strong>ger die<br />
Unterschiede zwischen den Ergebnissen <strong>der</strong> wie<strong>der</strong>holt durchgeführten <strong>Schülerbeurteilung</strong>en<br />
s<strong>in</strong>d, d.h. das Vertrauen <strong>in</strong> die Interpretation <strong>der</strong> Ergebnisse <strong>und</strong> ihre Verallgeme<strong>in</strong>erung<br />
steigt, wenn sich die Abweichungen <strong>der</strong> Ergebnisse <strong>in</strong> e<strong>in</strong>er möglichst<br />
engen Bandbreite bewegen (Traub & Rowley, 1994, S. 171). Das Gütekriterium Zuverlässigkeit<br />
(Reliabilität) <strong>in</strong>formiert nun genau darüber, wie gross bzw. wie ger<strong>in</strong>g die<br />
Abweichungen <strong>der</strong> Ergebnisse s<strong>in</strong>d, wenn e<strong>in</strong>e <strong>Schülerbeurteilung</strong> e<strong>in</strong>- o<strong>der</strong> mehrmals<br />
wie<strong>der</strong>holt würde. Es gibt Auskunft über das Mass an Konsistenz bzw. Stabilität, über<br />
das die Ergebnisse <strong>der</strong> <strong>Schülerbeurteilung</strong> verfügen, die zu verschiedenen Zeitpunkten<br />
o<strong>der</strong> unter verschiedenen gleichartigen Bed<strong>in</strong>gungen entstanden s<strong>in</strong>d (AERA, APA &<br />
NCME, 1999, S. 25; Feldt & Brennan, 1994, S. 105). Konkret handelt es sich beim<br />
Gütekriterium Zuverlässigkeit (Reliabilität) um e<strong>in</strong>e Schätzung des Messfehlers, mit<br />
dem die Ergebnisse <strong>der</strong> <strong>Schülerbeurteilung</strong> behaftet s<strong>in</strong>d. H<strong>in</strong>ter dem Begriff „Messfehler“<br />
verbergen sich alle denkbaren zufälligen <strong>und</strong> damit unvorhersehbaren E<strong>in</strong>flüsse,<br />
welche dafür verantwortlich s<strong>in</strong>d, dass das ermittelte Messergebnis vom „Wahren<br />
Messwert“ 9 abweicht (Feldt & Brennan, 1989, S. 105; siehe auch AERA, APA &<br />
NCME, 1999, S. 26–27). Nach Hanna (1993, S. 423–427) existieren bei <strong>der</strong> <strong>Schülerbeurteilung</strong><br />
vier Hauptquellen für <strong>der</strong>artige Messfehler (siehe auch AERA, APA &<br />
NCME, 1999, S. 26–27; Feldt & Brennan, 1989, S. 107–108):<br />
(1) Messfehler aufgr<strong>und</strong> <strong>der</strong> Aufgabenzusammenstellung<br />
Da <strong>in</strong> den wenigsten Fällen e<strong>in</strong> Fachgebiet umfassend geprüft werden kann, wird<br />
e<strong>in</strong>e möglichst repräsentative Stichprobe an Aufgaben zusammengestellt. Selbst<br />
9 Die Vorstellung vom „Wahren Messwert“ beruht dabei auf <strong>der</strong> Annahme, dass das messbare Verhalten e<strong>in</strong>er<br />
Person bzw. Personengruppe zum<strong>in</strong>dest über e<strong>in</strong>e bestimmte Zeit h<strong>in</strong>weg relativ stabil ist, so dass sich durch<br />
wie<strong>der</strong>holte gleichartige Messungen Verhaltenskonstanten feststellen lassen (siehe hierzu ausführlich <strong>und</strong><br />
kritisch Meier, 1994). Mathematisch ausgedrückt entspricht <strong>der</strong> „Wahre Messwert“ dem hypothetischen<br />
Durchschnittswert, <strong>der</strong> sich aus <strong>der</strong> mehrfachen Durchführung e<strong>in</strong>er Messung ergibt (Traub & Rowley, 1994,<br />
S. 173–175).