Testwerkstatt: Alternative Aufgabentypen entwickeln
Testwerkstatt: Alternative Aufgabentypen entwickeln
Testwerkstatt: Alternative Aufgabentypen entwickeln
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
STANDARDS<br />
Testauswertung:<br />
Aufgaben überprüfen<br />
Wie sieht die tatsächliche Schwierigkeit<br />
der Aufgaben aus, gemessen<br />
an der Lösungswahrscheinlichkeit<br />
der jeweiligen Aufgabe?<br />
Bestimmt wird die Lösungswahrscheinlichkeit<br />
über den Mittelwert<br />
der aufgetretenen Aufgabenlösungen.<br />
Dazu wird pro Schüler und<br />
Aufgabe jeweils der Wert „1“ für<br />
gelöst, der Wert „0“ für nicht gelöst<br />
vergeben, bei den offenen<br />
Aufgaben „0,5“ für teilweise gelöst<br />
(vgl. Kasten mit Lösungserwartungen).<br />
Einfach ist die Berechnung<br />
mit Statistikprogrammen<br />
wie SPSS, doch auch die Berechnung<br />
mit Taschenrechner ist<br />
problemlos möglich (dazu pro<br />
Aufgabe die Summe der vergebenen<br />
Werte ermitteln und durch<br />
die Anzahl der Schüler dividieren,<br />
die die Aufgabe bearbeitet<br />
haben). 6 Abb. 4 zeigt die auf diese<br />
Weise bestimmten tatsächlichen<br />
Aufgabenschwierigkeiten des<br />
durchgeführten Tests 7 , für die Gesamtstichprobe<br />
und differenziert<br />
nach den Schularten der teilnehmenden<br />
Schüler. So sind die Aufgaben<br />
1 (Lösungswahrscheinlichkeit<br />
33,85%) und 9 (32,31%)<br />
insgesamt die schwierigsten Aufgaben<br />
im Test. Besonders hervorzuheben<br />
ist, dass Aufgabe 1<br />
diesen Schwierigkeitsgrad trotz<br />
der Vorgabe von Antwortmöglichkeiten<br />
erreicht.<br />
Ungeeignete Aufgaben<br />
aufspüren<br />
Die ermittelten Lösungswahrscheinlichkeiten<br />
ermöglichen<br />
auch, untaugliche Aufgaben aufzuspüren.<br />
Für die am Test teilnehmenden<br />
Klassen – Spezialschüler,<br />
„Durchschnitts“-Gymnasiasten<br />
und Regelschüler – sind begründet<br />
verschiedene Leistungsniveaus<br />
anzunehmen. Die „normalen“<br />
Gymnasiasten müssten die Aufgaben<br />
demnach häufiger lösen können<br />
als die Regelschüler, aber weniger<br />
häufig als die hochbegabten<br />
Spezialschüler. Verdächtig sind<br />
also zum einen Aufgaben, bei de-<br />
Mittel- Gesamt- Gymnasium Gymnasium Regelschule<br />
werte stichprobe ‚spezial’ ‚normal’ ‚Realschulzweig’<br />
Aufgabe Nr.<br />
(n = 66) (n1 = 15) (n2 = 35) (n3 = 16)<br />
1 ,3385 ,4667 ,4118 ,0625<br />
2 ,7273 ,8667 ,7714 ,5000<br />
3 ,5234 ,5333 ,6000 ,3214<br />
4 ,8939 1,000 ,9429 ,6875<br />
5 ,8030 1,000 ,8000 ,6250<br />
6 ,4308 ,6667 ,4706 ,1250<br />
7 ,6615 ,9333 ,6765 ,3750<br />
8 ,6462 ,8667 ,6324 ,4688<br />
9 ,3231 ,5000 ,3529 ,0938<br />
10 ,7121 ,7667 ,7000 ,6875<br />
Abb. 4: Bei einer systematischen Testauswertung<br />
geben die Mittelwerte der Testteilnehmer Auskunft<br />
über die Schwierigkeit der Aufgaben. Je niedriger der<br />
Wert, umso schwieriger ist die Aufgabe.<br />
42<br />
nen alle drei Gruppen (innerhalb<br />
einer Lerngruppe: leistungsstärkste<br />
und leistungsschwächste Lernende)<br />
in etwa gleich gut antworten.<br />
Solche Aufgaben differenzieren<br />
zu wenig und wurden deshalb<br />
aus dem Test entfernt. Ebenso<br />
misstrauisch zu betrachten sind<br />
Aufgaben, bei denen die Lernenden<br />
mit dem insgesamt besten<br />
Testergebnis deutlich schlechter<br />
abschneiden als die Lernenden<br />
mit dem insgesamt schlechtesten<br />
Testergebnis. Auch diese Aufgaben<br />
eignen sich offensichtlich<br />
nicht zur Feststellung des tatsächlichen<br />
Leistungsvermögens und<br />
müssen bei einer künftigen Verwendung<br />
des Test weggelassen<br />
oder modifiziert werden. Genauer<br />
zu prüfen sind schließlich auch<br />
Mehrfachwahlaufgaben, bei denen<br />
einzelne Distraktoren überhaupt<br />
nicht gewählt wurden. Diese<br />
Distraktoren sind für die Lernenden<br />
offenbar nicht hinreichend<br />
plausibel und müssen ggf.<br />
ersetzt oder verändert werden.<br />
Schlussfolgerungen für<br />
die Lernenden ziehen<br />
Wie lässt sich ein solcher Test für<br />
die weitere Unterrichtsplanung<br />
und die Förderung der Lernenden<br />
nutzen? Hierzu ist es nötig, die<br />
Ergebnisse noch etwas genauer zu<br />
betrachten und z. B. zu erheben,<br />
wie häufig welche Antwortmöglichkeiten<br />
gewählt wurden. Für<br />
die Aufgaben 5 und 7 ergibt sich<br />
dabei folgendes Bild: Sechs von<br />
sechzehn Regelschülern wählen<br />
Antwort 5a und 5b, ein Viertel<br />
der Regelschüler/innen kreuzt<br />
Antwort 7a an. Damit offenbaren<br />
diese Lernenden deutliche Defizite<br />
im Wortschatzwissen. „Gemein“<br />
verstehen sie im Sinne von<br />
„fies“, „unangenehm“; „erlauben“<br />
hat für sie mit „dürfen“ zu tun.<br />
Hier bestehen also allem Anschein<br />
nach ganz grundlegende<br />
Hürden für das Verstehen literarischer<br />
Texte. Eine Konsequenz aus<br />
dem Ergebnis könnte gezielte<br />
Wortschatzarbeit sein (Wortfelder<br />
bilden, Synonyme finden, mit Stilebenen<br />
experimentieren).<br />
Interessant ist auch die Beobachtung,<br />
dass die meisten Lernenden<br />
offensichtlich die eigene Lebenswirklichkeit<br />
mit der literarischen<br />
Wirklichkeit identifizieren.<br />
Nur so erklärt sich u. a., dass bei<br />
Aufgabe 1 die Antworten b, c und<br />
d für die Mehrzahl der Schülerinnen<br />
und Schüler wählbar waren.<br />
Diese Distraktoren bieten Antworten<br />
an, die verstärkt die eigenen<br />
Erfahrungen der Lernenden<br />
widerspiegeln. Die Ergebnisse zu<br />
Aufgabe 10 stützen gleichfalls die<br />
angeführte These. Diese Aufgabe<br />
konnte unabhängig von der Wahl<br />
der Antwortmöglichkeit a oder b<br />
gelöst werden. Maßgeblich war<br />
die Qualität der Begründung (vgl.<br />
Kasten). Die meisten Teilnehmenden<br />
entschieden sich für Antwort<br />
a. Diejenigen, die a gewählt haben,<br />
begründen diese Wahl zum<br />
Deutschunterricht 5 / 2005