Der Portfolio-Ansatz in der Schülerbeurteilung der USA und seine ...
Der Portfolio-Ansatz in der Schülerbeurteilung der USA und seine ...
Der Portfolio-Ansatz in der Schülerbeurteilung der USA und seine ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
238<br />
hoch erschienen, blieben jene <strong>in</strong> Vermont unter dem akzeptablen Niveau. Umso <strong>in</strong>teressanter<br />
ist es daher, welche Resultate aus an<strong>der</strong>en Reliabilitätsstudien vorliegen.<br />
Reliabilitätsstudien <strong>der</strong> Dallas Public Schools<br />
Shapley <strong>und</strong> P<strong>in</strong>to (1996) untersuchten für die im Schuljahr 1994−95 im K<strong>in</strong><strong>der</strong>garten<br />
sowie <strong>in</strong> <strong>der</strong> 1. <strong>und</strong> 2. Klasse (1 st , 2 nd grade) erstellten Schreib-<strong>Portfolio</strong>s die Übere<strong>in</strong>stimmung<br />
<strong>der</strong> Bewertungen <strong>der</strong> Klassenlehrer mit jener von neutralen Beurteilern, die<br />
als Lehrpersonen <strong>der</strong> Dallas Public Schools jedoch sowohl mit dem <strong>Portfolio</strong>-Prozess<br />
vertraut <strong>und</strong> für die <strong>Portfolio</strong>-Beurteilung entsprechend ausgebildet <strong>und</strong> tra<strong>in</strong>iert waren.<br />
Aus ökonomischen Gründen konnten Shapley <strong>und</strong> P<strong>in</strong>to (1996, S. 18) nur e<strong>in</strong>e relativ<br />
kle<strong>in</strong>e Stichprobe von 45 <strong>Portfolio</strong>s ihren Reliabilitätsuntersuchungen zugr<strong>und</strong>e<br />
legen. Dies schränkt die Aussagekraft <strong>der</strong> Ergebnisse zwar e<strong>in</strong>, dennoch liessen sich<br />
<strong>in</strong>teressante Tendenzen erkennen. Für die Stufe K<strong>in</strong><strong>der</strong>garten konnte e<strong>in</strong>e Übere<strong>in</strong>stimmung<br />
zwischen den Bewertungen <strong>der</strong> Klassenlehrer <strong>und</strong> <strong>der</strong> neutralen Korrigierenden<br />
von knapp 25 %, für die 1. <strong>und</strong> 2. Klasse noch 13 % bei leistungsstarken Lernenden<br />
(English Proficient) <strong>und</strong> gar nur 6 % bei leistungsschwächeren Lernenden<br />
(Limited English Proficient) festgestellt werden. Diese sehr tiefen Übere<strong>in</strong>stimmungswerte<br />
erklärten sich gemäss Shapley <strong>und</strong> P<strong>in</strong>to (1996, S. 20) e<strong>in</strong>erseits aus <strong>der</strong> Tendenz<br />
<strong>der</strong> Klassenlehrer, die <strong>Portfolio</strong>s höher zu bewerten als die Zweitkorrektoren, an<strong>der</strong>erseits<br />
konnte für sehr viele Lernziele, welche die <strong>Portfolio</strong>s abdecken sollten, gar<br />
ke<strong>in</strong> Übere<strong>in</strong>stimmungswert berechnet werden, weil entwe<strong>der</strong> die Lehrpersonen das<br />
entsprechende Lernziel nicht bewertet hatten o<strong>der</strong> aber sich die Zweitkorrektoren aufgr<strong>und</strong><br />
<strong>der</strong> Materialien im <strong>Portfolio</strong> ausserstande sahen, e<strong>in</strong>e für den Vergleich nötige<br />
Bewertung vorzunehmen. Letzteres ergab sich zum E<strong>in</strong>en, weil e<strong>in</strong>zelne Lernziele<br />
nicht o<strong>der</strong> nicht ausreichend dokumentiert wurden, zum An<strong>der</strong>n, weil die Zweitkorrektoren<br />
schlicht ke<strong>in</strong>en Zusammenhang zwischen den Lernzielen <strong>und</strong> den <strong>Portfolio</strong>-Inhalten<br />
herstellen konnten. Es fehlten hier die notwendigen Erklärungen <strong>der</strong> Lehrpersonen.<br />
Zu den wichtigsten Erkenntnissen <strong>der</strong> Reliabilitätsstudie von Shapely <strong>und</strong> P<strong>in</strong>to<br />
(1996) gehörte deshalb, dass trotz entsprechen<strong>der</strong> Richtl<strong>in</strong>ien für die Lehrpersonen die<br />
<strong>Portfolio</strong>s von den e<strong>in</strong>zelnen Lehrpersonen so unterschiedlich umgesetzt wurden, dass<br />
s<strong>in</strong>nvolle Reliabilitätsuntersuchungen grösstenteils verunmöglicht wurden. Nicht nur<br />
die Reliabilitätsergebnisse, son<strong>der</strong>n auch die Gr<strong>und</strong>lagen für diese Studie waren also<br />
<strong>in</strong>sgesamt höchst unbefriedigend.<br />
E<strong>in</strong>e ausführlichere Reliabilitätsstudie führten Shapley <strong>und</strong> Bush (1999, S. 111−132)<br />
für das im Schuljahr 1995−96 erstellte Sprach-<strong>Portfolio</strong> durch, bei <strong>der</strong> e<strong>in</strong>e repräsentative<br />
Stichprobe von <strong>in</strong>sgesamt 150 <strong>Portfolio</strong>s für die drei Schulstufen vom K<strong>in</strong><strong>der</strong>garten<br />
bis zur 2. Klasse (2 nd grade) die Gr<strong>und</strong>lage bildete. Wie<strong>der</strong>um wurde verglichen,<br />
<strong>in</strong>wieweit die Bewertungen <strong>der</strong> Klassenlehrer mit jenen von Zweitkorrektoren<br />
übere<strong>in</strong>stimmten. Zu diesem Zweck berechneten sie für jedes zu bewertende Lernziel<br />
des <strong>Portfolio</strong>s drei Grössen (Shapley & P<strong>in</strong>to, 1999, S. 118): (1) die Abweichungen<br />
bei den Mittelwerten, (2) die <strong>in</strong> Prozent ausgedrückte Übere<strong>in</strong>stimmung <strong>der</strong> Punktwerte<br />
<strong>und</strong> (3) die Korrelation <strong>der</strong> Bewertungen. Die Berechnungen für diese drei Grössen<br />
führten zu folgenden Ergebnissen:<br />
• Die Resultate <strong>der</strong> Mittelwertsanalysen bestätigten die bereits zuvor festgestellte<br />
Tendenz, dass Klassenlehrer, unabhängig auf welcher Schulstufe, die <strong>Portfolio</strong>s<br />
höher bewerten als neutrale Zweitkorrektoren. Die dabei festgestellten Unterschiede