Zur Bestimmung der Zählbarkeit deutscher Substantive - Ruhr ...
Zur Bestimmung der Zählbarkeit deutscher Substantive - Ruhr ...
Zur Bestimmung der Zählbarkeit deutscher Substantive - Ruhr ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
7.3 Überwachte Klassifikationsverfahren 243<br />
Singular steht?<br />
Die folgenden Quantoren werden geprüft:<br />
• alle, aller, ausreichend, einige, einiger, genug, genügend, jegliche, jeglicher, mehr,<br />
reichlich, sämtliche, sämtlicher, weniger<br />
14. Genus des Lemmas:<br />
Welches ist das am häufigsten zugewiesene Genus <strong>der</strong> morphologischen Analyse<br />
aller Token eines Lemmas im Korpus?<br />
15. Suffix des Lemmas:<br />
Welches Suffix besitzt das Lemma? Die Abwesenheit eines Suffixes ist als ein<br />
eigenständiger (frei wählbarer) Wert zu vermerken.<br />
Die folgenden Suffixe wurden berücksichtigt:<br />
• -ant, -anz, -chen, -ei, -el, -em, -en, -ent, -enz, -er, -gie, -heit, -ie, -ing, -ion, -ist, -ium,<br />
-keit, -kum, -ment, -mus, -nis, -phie, -schaft, -tät, -teur, -tie, -tion, -tor, -tum, -tur,<br />
-um, -ung, -zeug<br />
Die vorgestellten 14 numerischen und zwei kategorialen Merkmale sind keineswegs<br />
als perfekt o<strong>der</strong> gar vollständig zu betrachten. Im Falle einer korpusbasierten Studie<br />
muss grundsätzlich eine Abwägung zwischen theoretischen Grundüberlegungen zur<br />
Identifizierung einer Kategorie (hier die <strong>Zählbarkeit</strong>) und <strong>der</strong> praktischen<br />
Umsetzbarkeit <strong>der</strong> Datenerhebung getroffen werden.<br />
Die Überprüfung, ob eine Präpositionalphrase bzw. ein Relativsatz ein Substantiv<br />
semantisch modifiziert, ist automatisiert – zumindest mit <strong>der</strong> im verwendeten<br />
VORABVERSION<br />
Korpus vorhandenen Information – nur bedingt durchzuführen. Eine gewisse<br />
Fehlerquote ist daher zu erwarten, wenn auch eine erhöhte Frequenz dieses<br />
Merkmals bei nicht-zählbaren gegenüber zählbaren Lemmata von mir erwartet wird<br />
(siehe auch Kapitel 6.3.2).<br />
Die Listen überprüfter Quantoren sind ebenfalls fehleranfällig. Hierbei muss<br />
abgewägt werden, ob und wie frequent ein vermeintlicher Quantor in einer an<strong>der</strong>en<br />
Verwendungsweise im Korpus zu finden ist und somit die Daten verfälschen könnte.<br />
So kann etwas, wie in (2), auch in nicht quantifizieren<strong>der</strong> Position auftreten und somit<br />
einen verfälschten Hinweis auf die <strong>Zählbarkeit</strong>sklasse des im Kontext auftretenden<br />
Substantivs liefern.<br />
(2) „Früher habe ich gedacht, Theater ist etwas Objektives, und man muss die<br />
Geschichte ganz von sich weghalten.“ (Neue Zürcher Zeitung)