04.11.2013 Aufrufe

Zur Bestimmung der Zählbarkeit deutscher Substantive - Ruhr ...

Zur Bestimmung der Zählbarkeit deutscher Substantive - Ruhr ...

Zur Bestimmung der Zählbarkeit deutscher Substantive - Ruhr ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

42 Kapitel 3: Erste Annotationsiteration<br />

Die Annotatoren waren nicht ausschließlich an die Verwendung <strong>der</strong> von Allan<br />

definierten Testumgebungen beziehungsweise an die jeweiligen deutschen Versionen<br />

dieser Testumgebungen gebunden. Stattdessen konnten auch<br />

konzeptuelle/semantische Kriterien in die <strong>Bestimmung</strong> <strong>der</strong> <strong>Zählbarkeit</strong> einzelner<br />

Lemmata einfließen, sofern es <strong>der</strong> Annotator im Einzelfall für angemessen erachtete.<br />

Ferner war es dem Annotator gestattet eine Internetrecherche für <strong>Substantive</strong> zu<br />

starten, um im Zweifelsfall ein besseres Sprachverständnis für diese zu erhalten.<br />

Strikte Richtlinien, an die sich die Annotatoren im Fall von wi<strong>der</strong>sprüchlichen<br />

<strong>Zählbarkeit</strong>sklassen hätten halten können, gab es zu diesem Zeitpunkt nicht.<br />

Annotiert wurden die bereits genannten Klassen zählbar, Dual-Life, nur-Plural und<br />

nicht-zählbar. Zusätzlich konnten die Annotatoren Eigennamen und<br />

fremdsprachliches Material als solches markieren (POS-Tags: NE, FM). Sofern ein<br />

Annotator keine Entscheidung bezüglich <strong>der</strong> <strong>Zählbarkeit</strong>sklasse treffen konnte,<br />

wurde das jeweilige Lemma mit einem entsprechenden Tag (?) versehen.<br />

Wenn möglich sollten die Annotatoren mutmaßlich polyseme und/o<strong>der</strong> homonyme<br />

<strong>Substantive</strong> zusätzlich markieren. Dies stellte sich jedoch bereits nach kurzer Zeit als<br />

nicht durchführbar heraus, da entsprechende Ambiguitäten erst in konkret<br />

gegebenen Kontexten ersichtlich werden, die aber den Annotatoren zum Zeitpunkt<br />

<strong>der</strong> Annotation nicht zur Verfügung standen. Des Weiteren stellt sich die Frage,<br />

inwieweit gewisse Lesarten eines ambigen Substantivs überhaupt im Korpus<br />

auftreten und somit die Ergebnisse beeinflussen würden. Würde ein Kontext zur<br />

Verfügung gestellt werden, beispielsweise in Form einer Liste <strong>der</strong> Sätze, in denen das<br />

Substantiv im Korpus aufgetaucht ist, wäre dennoch nicht sichergestellt, dass alle<br />

VORABVERSION<br />

Lesarten eines ambigen Substantivs auch in Erscheinung treten.<br />

Das ambige Wort Bank ist ein gutes Beispiel für ein als homonym zu annotierendes<br />

Wort, sind doch beide Lesarten mit hoher Wahrscheinlichkeit in einer Tageszeitung<br />

zu finden. Wirklich zwingend notwendig ist die Beachtung dieser Ambiguität jedoch<br />

nicht, da beide Lesarten die gleiche <strong>Zählbarkeit</strong>sklasse erhalten sollten (zählbar). Wie<br />

verhält es sich jedoch mit Wetter, dass nicht nur die örtlichen Wetterverhältnisse<br />

bezeichnet (nicht-zählbar), son<strong>der</strong>n auch die in einem Bergwerk befindlichen Gase<br />

benennt und ausschließlich im Plural verwendet wird (nur-Plural)? Letztere Lesart<br />

dürfte verschwindend gering in einer Tageszeitung zu beobachten sein und somit<br />

nicht zwingend eine Kennzeichnung als ambig und des Weiteren eine daraus<br />

resultierende geson<strong>der</strong>te Behandlung bei <strong>der</strong> Auswertung erfor<strong>der</strong>n.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!