Stadtfeld, Tobias (2013) - Sprachwissenschaftliches Institut - Ruhr ...
Stadtfeld, Tobias (2013) - Sprachwissenschaftliches Institut - Ruhr ...
Stadtfeld, Tobias (2013) - Sprachwissenschaftliches Institut - Ruhr ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
34 Kapitel 3: Erste Annotationsiteration<br />
von Präposition-Substantiv-Sequenzen“ in dessen Rahmen auch diese Arbeit<br />
entstanden ist. Die übergeordnete Fragestellung dieses Projekts ist die Kompatibilität<br />
von einer ausgewählten Menge von Präpositionen und einem zählbaren Substantiv im<br />
Singular, sofern die Präpositionalphrase keinen Artikel realisiert.<br />
Der Dudenregel 442 (Dudenredaktion, 2005) folgend, entsprechen Vorkommen<br />
einer artikellosen PP (PNC) mit einem zählbaren Substantiv im Singular nicht dem<br />
Regelfall und müssten somit als Ausnahmen betrachtet werden:<br />
„Substantive mit Merkmalskombination »zählbar« plus Singular haben also grundsätzlich<br />
immer ein Artikelwort bei sich, und wenn es als letzte Möglichkeit der indefinite Artikel ist:“<br />
(Dudenredaktion, 2005, S. 337)<br />
Himmelmann (1998) stellt jedoch fest, dass derartige Konstruktionen nicht nur im<br />
Deutschen zu beobachten sind, sondern PNCen ein sprachübergreifendes Phänomen<br />
darstellen und eine regelhafte Irregularität aufweisen, d. h. nicht als vollständig<br />
idiomatisch zu betrachten sind. Ferner zeigen weitere Untersuchungen zu PNCen,<br />
dass diese Konstruktionen als produktiv zu betrachten sind (Stvan, 1998; Baldwin et<br />
al., 2006; Dömges et al., 2007) und daher eine Behandlung von nicht regelkonformen<br />
Konstruktionen nicht mittels Auflistung von Ausnahmen möglich ist.<br />
Ziel des übergeordneten Projekts ist es daher, die Lizenzierungseigenschaften einer<br />
artikellosen Präpositionalphrase mit einem zählbaren Substantiv im Singular zu<br />
bestimmen. Während eine ausführlichere Diskussion dieser Konstruktionen an dieser<br />
Stelle jedoch nicht zielführend ist, sollte es dennoch offensichtlich sein, dass für eine<br />
weitere Analyse nicht regelkonformer PNCen es hilfreich ist, eine Liste potenziell<br />
zählbarer Substantive zu generieren. Die in dieser Liste gelisteten Substantive<br />
innerhalb von PNCen in einem großen Korpus zu suchen und anschließend mögliche<br />
Funde tiefer gehend zu analysieren, war der naheliegende und antreibende Gedanke<br />
dieser ersten Annotationsiteration.<br />
Bei dem dabei und ich weiterem Verlauf dieser Arbeit ebenfalls eingesetzten<br />
Korpus handelte es sich um die Jahrgänge 1993 bis 1999 der Tageszeitung Neue<br />
Zürcher Zeitung. Das Korpus enthält insgesamt ca. 230 Mio. Token, die u. a. mithilfe<br />
des Regression-forest-Taggers (Schmid & Laws, 2008) sowie des TreeTaggers<br />
(Schmid, 1995) einen POS-Tag erhalten haben. Des Weiteren wurde für jedes Token<br />
mittels SMOR (Schmid et al., 2004) das entsprechende Lemma bestimmt sowie eine<br />
morphologische Analyse durchgeführt.<br />
Da das Korpus bereits alle wichtigen Annotationen enthielt, wurde es auch als<br />
Datenquelle für eine zufällige Auswahl bezüglich der Zählbarkeit zu annotierender<br />
Substantive verwendet.<br />
Um eine Grundmenge zu annotierender Substantive zu erhalten, wurde eine Liste<br />
24 Die Förderung des Projektes erfolgt durch die Deutsche Forschungsgemeinschaft (DFG) unter der Erteilungsnummer KI-759/5.