27.04.2014 Aufrufe

Stadtfeld, Tobias (2013) - Sprachwissenschaftliches Institut - Ruhr ...

Stadtfeld, Tobias (2013) - Sprachwissenschaftliches Institut - Ruhr ...

Stadtfeld, Tobias (2013) - Sprachwissenschaftliches Institut - Ruhr ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

34 Kapitel 3: Erste Annotationsiteration<br />

von Präposition-Substantiv-Sequenzen“ in dessen Rahmen auch diese Arbeit<br />

entstanden ist. Die übergeordnete Fragestellung dieses Projekts ist die Kompatibilität<br />

von einer ausgewählten Menge von Präpositionen und einem zählbaren Substantiv im<br />

Singular, sofern die Präpositionalphrase keinen Artikel realisiert.<br />

Der Dudenregel 442 (Dudenredaktion, 2005) folgend, entsprechen Vorkommen<br />

einer artikellosen PP (PNC) mit einem zählbaren Substantiv im Singular nicht dem<br />

Regelfall und müssten somit als Ausnahmen betrachtet werden:<br />

„Substantive mit Merkmalskombination »zählbar« plus Singular haben also grundsätzlich<br />

immer ein Artikelwort bei sich, und wenn es als letzte Möglichkeit der indefinite Artikel ist:“<br />

(Dudenredaktion, 2005, S. 337)<br />

Himmelmann (1998) stellt jedoch fest, dass derartige Konstruktionen nicht nur im<br />

Deutschen zu beobachten sind, sondern PNCen ein sprachübergreifendes Phänomen<br />

darstellen und eine regelhafte Irregularität aufweisen, d. h. nicht als vollständig<br />

idiomatisch zu betrachten sind. Ferner zeigen weitere Untersuchungen zu PNCen,<br />

dass diese Konstruktionen als produktiv zu betrachten sind (Stvan, 1998; Baldwin et<br />

al., 2006; Dömges et al., 2007) und daher eine Behandlung von nicht regelkonformen<br />

Konstruktionen nicht mittels Auflistung von Ausnahmen möglich ist.<br />

Ziel des übergeordneten Projekts ist es daher, die Lizenzierungseigenschaften einer<br />

artikellosen Präpositionalphrase mit einem zählbaren Substantiv im Singular zu<br />

bestimmen. Während eine ausführlichere Diskussion dieser Konstruktionen an dieser<br />

Stelle jedoch nicht zielführend ist, sollte es dennoch offensichtlich sein, dass für eine<br />

weitere Analyse nicht regelkonformer PNCen es hilfreich ist, eine Liste potenziell<br />

zählbarer Substantive zu generieren. Die in dieser Liste gelisteten Substantive<br />

innerhalb von PNCen in einem großen Korpus zu suchen und anschließend mögliche<br />

Funde tiefer gehend zu analysieren, war der naheliegende und antreibende Gedanke<br />

dieser ersten Annotationsiteration.<br />

Bei dem dabei und ich weiterem Verlauf dieser Arbeit ebenfalls eingesetzten<br />

Korpus handelte es sich um die Jahrgänge 1993 bis 1999 der Tageszeitung Neue<br />

Zürcher Zeitung. Das Korpus enthält insgesamt ca. 230 Mio. Token, die u. a. mithilfe<br />

des Regression-forest-Taggers (Schmid & Laws, 2008) sowie des TreeTaggers<br />

(Schmid, 1995) einen POS-Tag erhalten haben. Des Weiteren wurde für jedes Token<br />

mittels SMOR (Schmid et al., 2004) das entsprechende Lemma bestimmt sowie eine<br />

morphologische Analyse durchgeführt.<br />

Da das Korpus bereits alle wichtigen Annotationen enthielt, wurde es auch als<br />

Datenquelle für eine zufällige Auswahl bezüglich der Zählbarkeit zu annotierender<br />

Substantive verwendet.<br />

Um eine Grundmenge zu annotierender Substantive zu erhalten, wurde eine Liste<br />

24 Die Förderung des Projektes erfolgt durch die Deutsche Forschungsgemeinschaft (DFG) unter der Erteilungsnummer KI-759/5.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!