13.07.2013 Aufrufe

Kognitionslinguistische und lernpsychologische ... - Cognitive Science

Kognitionslinguistische und lernpsychologische ... - Cognitive Science

Kognitionslinguistische und lernpsychologische ... - Cognitive Science

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Wort Anzahl der Texte, in<br />

denen das Wort<br />

enthalten war. (in %)<br />

Wort Anzahl der Texte, in<br />

denen das Wort<br />

enthalten war. (in %)<br />

97<br />

Wort Anzahl der Texte, in<br />

denen das Wort<br />

enthalten war. (in %)<br />

armchair 57,7 ice 21,8 Pulse 32,1<br />

backgro<strong>und</strong> 32,5 ill 57,7 Room 60,3<br />

blanket 33,3 lamp 44,9 scissors 24,4<br />

Books 33,3 living room 41 Shelf 20,5<br />

Check... 32,5 look... 51,3 Sick 15,4<br />

Cold 15,38 measure... 18 Side 14,1<br />

doctor 100 next 28,2 sweat… 51,3<br />

glasses 42,31 old 48,7 Table 89,8<br />

Hand 24,4 patient... 51,2 Tool 30,8<br />

Head 58,8 picture 70,5 vase(s) 23,1<br />

wear... 70,5 pill(s) 33,3 watch 39,4<br />

→ Im Durchschnitt tritt ein Wort der Liste in 41,5 % der Texte auf. (Die Standardabweichung beträgt 21 %)<br />

Tabelle 3.8: Prozentualer Anteil der Texte, in denen die für die Bildbeschreibung gr<strong>und</strong>sätzlich typischen<br />

Wörter aufgetreten sind.<br />

Nicht nur über die gr<strong>und</strong>sätzliche thematische Angemessenheit einer zu evaluierenden<br />

Bildbeschreibung kann man eine Aussage treffen. Ganz rudimentär lässt sich auch<br />

überprüfen, ob überhaupt ein in Sätzen formulierter Text vorliegt. Notwendig ist dabei nur,<br />

die prozentuale Häufigkeit der fünf meistverwendeten Wörter der Korpora (the, a, is, and, of)<br />

mit der Häufigkeit dieser Wörter im Benutzertext innerhalb eines gewissen Toleranzrahmens<br />

abzugleichen.<br />

Erst danach sollte das Programm zur Evaluation an sich übergehen. Der erste Schritt<br />

sollte dabei sein, die Bildbeschreibung einer bestimmten fremdsprachlichen<br />

Entwicklungsstufe zuzuordnen. Ziel der Auswertung des erhobenen Datenmaterials war es,<br />

eine Möglichkeit zu finden, wie diese Aufgabe zuverlässig von einem Computer bewältigt<br />

werden kann. Es wurden verschiedene Kriterien betrachtet, mit denen sich Ähnlichkeiten<br />

zwischen einem Vergleichskorpus <strong>und</strong> einer einzelnen Beschreibung feststellen lassen. Einige<br />

sind sehr geeignet, andere nur bedingt <strong>und</strong> wieder andere gar nicht. Unter Verwendung der<br />

aussagekräftigsten von ihnen habe ich einen Algorithmus entworfen, der auf folgende Weise<br />

eine Zuordnung vornimmt. Am Anfang wird festgestellt, wie viele Schlüsselwörter sich<br />

jeweils beim Vergleich des Benutzertextes mit den einzelnen Korpora ergeben. Diejenigen<br />

Korpora, welche die kürzeste Liste von Schlüsselwörtern hervorbringen, werden zu weiteren<br />

Abgleichen herangezogen. Der Rest, maximal jedoch drei, wird nicht weiterverarbeitet.<br />

Anschließend werden nacheinander, wie aus dem Beispiel in der Tabelle ersichtlich ist,<br />

weitere Vergleiche durchgeführt. Nach einem jeden wird eine Rangfolge gebildet, die angibt,<br />

welche Zuordnungen nach dem jeweiligen Kriterium am wahrscheinlichsten sind. Am Ende<br />

werden die von den Vergleichkorpora jeweils erzielten Ränge gewichtet <strong>und</strong> aufgerechnet.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!