Kognitionslinguistische und lernpsychologische ... - Cognitive Science
Kognitionslinguistische und lernpsychologische ... - Cognitive Science
Kognitionslinguistische und lernpsychologische ... - Cognitive Science
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Wort Anzahl der Texte, in<br />
denen das Wort<br />
enthalten war. (in %)<br />
Wort Anzahl der Texte, in<br />
denen das Wort<br />
enthalten war. (in %)<br />
97<br />
Wort Anzahl der Texte, in<br />
denen das Wort<br />
enthalten war. (in %)<br />
armchair 57,7 ice 21,8 Pulse 32,1<br />
backgro<strong>und</strong> 32,5 ill 57,7 Room 60,3<br />
blanket 33,3 lamp 44,9 scissors 24,4<br />
Books 33,3 living room 41 Shelf 20,5<br />
Check... 32,5 look... 51,3 Sick 15,4<br />
Cold 15,38 measure... 18 Side 14,1<br />
doctor 100 next 28,2 sweat… 51,3<br />
glasses 42,31 old 48,7 Table 89,8<br />
Hand 24,4 patient... 51,2 Tool 30,8<br />
Head 58,8 picture 70,5 vase(s) 23,1<br />
wear... 70,5 pill(s) 33,3 watch 39,4<br />
→ Im Durchschnitt tritt ein Wort der Liste in 41,5 % der Texte auf. (Die Standardabweichung beträgt 21 %)<br />
Tabelle 3.8: Prozentualer Anteil der Texte, in denen die für die Bildbeschreibung gr<strong>und</strong>sätzlich typischen<br />
Wörter aufgetreten sind.<br />
Nicht nur über die gr<strong>und</strong>sätzliche thematische Angemessenheit einer zu evaluierenden<br />
Bildbeschreibung kann man eine Aussage treffen. Ganz rudimentär lässt sich auch<br />
überprüfen, ob überhaupt ein in Sätzen formulierter Text vorliegt. Notwendig ist dabei nur,<br />
die prozentuale Häufigkeit der fünf meistverwendeten Wörter der Korpora (the, a, is, and, of)<br />
mit der Häufigkeit dieser Wörter im Benutzertext innerhalb eines gewissen Toleranzrahmens<br />
abzugleichen.<br />
Erst danach sollte das Programm zur Evaluation an sich übergehen. Der erste Schritt<br />
sollte dabei sein, die Bildbeschreibung einer bestimmten fremdsprachlichen<br />
Entwicklungsstufe zuzuordnen. Ziel der Auswertung des erhobenen Datenmaterials war es,<br />
eine Möglichkeit zu finden, wie diese Aufgabe zuverlässig von einem Computer bewältigt<br />
werden kann. Es wurden verschiedene Kriterien betrachtet, mit denen sich Ähnlichkeiten<br />
zwischen einem Vergleichskorpus <strong>und</strong> einer einzelnen Beschreibung feststellen lassen. Einige<br />
sind sehr geeignet, andere nur bedingt <strong>und</strong> wieder andere gar nicht. Unter Verwendung der<br />
aussagekräftigsten von ihnen habe ich einen Algorithmus entworfen, der auf folgende Weise<br />
eine Zuordnung vornimmt. Am Anfang wird festgestellt, wie viele Schlüsselwörter sich<br />
jeweils beim Vergleich des Benutzertextes mit den einzelnen Korpora ergeben. Diejenigen<br />
Korpora, welche die kürzeste Liste von Schlüsselwörtern hervorbringen, werden zu weiteren<br />
Abgleichen herangezogen. Der Rest, maximal jedoch drei, wird nicht weiterverarbeitet.<br />
Anschließend werden nacheinander, wie aus dem Beispiel in der Tabelle ersichtlich ist,<br />
weitere Vergleiche durchgeführt. Nach einem jeden wird eine Rangfolge gebildet, die angibt,<br />
welche Zuordnungen nach dem jeweiligen Kriterium am wahrscheinlichsten sind. Am Ende<br />
werden die von den Vergleichkorpora jeweils erzielten Ränge gewichtet <strong>und</strong> aufgerechnet.