04.11.2013 Aufrufe

Zur Bestimmung der Zählbarkeit deutscher Substantive - Ruhr ...

Zur Bestimmung der Zählbarkeit deutscher Substantive - Ruhr ...

Zur Bestimmung der Zählbarkeit deutscher Substantive - Ruhr ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

238 Kapitel 7: <strong>Zur</strong> automatisierten <strong>Bestimmung</strong> <strong>der</strong> <strong>Zählbarkeit</strong><br />

herangezogen werden. Eine solche ist in aller Regel einem nicht-überwachten<br />

Verfahren gegenüber überlegen.<br />

7.3 Überwachte Klassifikationsverfahren<br />

Die Verwendung überwachter Verfahren zur <strong>Bestimmung</strong> <strong>der</strong> lexikalischen<br />

<strong>Zählbarkeit</strong> mittels Korpusevidenz ist ein naheliegen<strong>der</strong> Schritt. Das händisch<br />

erstellte <strong>Zählbarkeit</strong>slexikon aus <strong>der</strong> zweiten Annotationsiteration liefert hierfür eine<br />

qualitativ hochwertige, aus insgesamt 960 Lemmata bestehende, Grundlage. Ich<br />

werde mich daher in diesem Abschnitt ausführlich mit <strong>der</strong> Anwendung überwachter<br />

Klassifikationsverfahren zur <strong>Bestimmung</strong> <strong>der</strong> lexikalischen <strong>Zählbarkeit</strong><br />

auseinan<strong>der</strong>setzen.<br />

Einleitend werde ich die Auswahl von Merkmalen beschreiben, die als Grundlage<br />

für eine maschinelle Klassifikation infrage kommen. Daran anschließend<br />

argumentiere ich für eine Reduktion <strong>der</strong> <strong>Zählbarkeit</strong>sklassen, die aufgrund des<br />

teilweise nicht ausreichenden Informationsgehaltes <strong>der</strong> verwendeten Merkmale<br />

notwendig wird.<br />

Hieran folgt eine Übersicht und Diskussion <strong>der</strong> Klassifikationsergebnisse mittels<br />

einer Reihe gängiger Klassifikationsalgorithmen aus dem Bereich des maschinellen<br />

Lernens. Einige <strong>der</strong> von mir präsentierten Klassifikationsergebnisse können als<br />

durchweg gut bezeichnet werden, weshalb ich abschließend die Möglichkeit zur<br />

Unterstützung <strong>der</strong> händischen Annotation mittels eben jener automatisiert<br />

erhobenen Klassifikationsergebnisse diskutieren werde. In dieser Integration<br />

maschineller Vorhersagen in den händischen Annotationsprozess sehe ich den<br />

größten praktischen Nutzen maschineller Lernverfahren zur <strong>Bestimmung</strong> <strong>der</strong><br />

<strong>Zählbarkeit</strong>.<br />

7.3.1 Verwendete Merkmale<br />

Die Idee, die lexikalische <strong>Zählbarkeit</strong> von <strong>Substantive</strong>n mittels überwachter<br />

maschineller Lernverfahren zu bestimmen, ist nicht neu. Baldwin und Bond (2003a),<br />

Baldwin und Bond (2003b) und Baldwin und Beek (2003) beschreiben dieses<br />

Vorgehen für die <strong>Bestimmung</strong> <strong>der</strong> <strong>Zählbarkeit</strong> englischer und nie<strong>der</strong>ländischer<br />

<strong>Substantive</strong>.<br />

Da die Autoren hierzu nicht auf eine eigenständige und händisch durchgeführte<br />

Annotation <strong>der</strong> <strong>Zählbarkeit</strong> einiger <strong>Substantive</strong> zurückgreifen können, verwenden sie<br />

VORABVERSION

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!