04.11.2013 Aufrufe

Zur Bestimmung der Zählbarkeit deutscher Substantive - Ruhr ...

Zur Bestimmung der Zählbarkeit deutscher Substantive - Ruhr ...

Zur Bestimmung der Zählbarkeit deutscher Substantive - Ruhr ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

7.3 Überwachte Klassifikationsverfahren 243<br />

Singular steht?<br />

Die folgenden Quantoren werden geprüft:<br />

• alle, aller, ausreichend, einige, einiger, genug, genügend, jegliche, jeglicher, mehr,<br />

reichlich, sämtliche, sämtlicher, weniger<br />

14. Genus des Lemmas:<br />

Welches ist das am häufigsten zugewiesene Genus <strong>der</strong> morphologischen Analyse<br />

aller Token eines Lemmas im Korpus?<br />

15. Suffix des Lemmas:<br />

Welches Suffix besitzt das Lemma? Die Abwesenheit eines Suffixes ist als ein<br />

eigenständiger (frei wählbarer) Wert zu vermerken.<br />

Die folgenden Suffixe wurden berücksichtigt:<br />

• -ant, -anz, -chen, -ei, -el, -em, -en, -ent, -enz, -er, -gie, -heit, -ie, -ing, -ion, -ist, -ium,<br />

-keit, -kum, -ment, -mus, -nis, -phie, -schaft, -tät, -teur, -tie, -tion, -tor, -tum, -tur,<br />

-um, -ung, -zeug<br />

Die vorgestellten 14 numerischen und zwei kategorialen Merkmale sind keineswegs<br />

als perfekt o<strong>der</strong> gar vollständig zu betrachten. Im Falle einer korpusbasierten Studie<br />

muss grundsätzlich eine Abwägung zwischen theoretischen Grundüberlegungen zur<br />

Identifizierung einer Kategorie (hier die <strong>Zählbarkeit</strong>) und <strong>der</strong> praktischen<br />

Umsetzbarkeit <strong>der</strong> Datenerhebung getroffen werden.<br />

Die Überprüfung, ob eine Präpositionalphrase bzw. ein Relativsatz ein Substantiv<br />

semantisch modifiziert, ist automatisiert – zumindest mit <strong>der</strong> im verwendeten<br />

VORABVERSION<br />

Korpus vorhandenen Information – nur bedingt durchzuführen. Eine gewisse<br />

Fehlerquote ist daher zu erwarten, wenn auch eine erhöhte Frequenz dieses<br />

Merkmals bei nicht-zählbaren gegenüber zählbaren Lemmata von mir erwartet wird<br />

(siehe auch Kapitel 6.3.2).<br />

Die Listen überprüfter Quantoren sind ebenfalls fehleranfällig. Hierbei muss<br />

abgewägt werden, ob und wie frequent ein vermeintlicher Quantor in einer an<strong>der</strong>en<br />

Verwendungsweise im Korpus zu finden ist und somit die Daten verfälschen könnte.<br />

So kann etwas, wie in (2), auch in nicht quantifizieren<strong>der</strong> Position auftreten und somit<br />

einen verfälschten Hinweis auf die <strong>Zählbarkeit</strong>sklasse des im Kontext auftretenden<br />

Substantivs liefern.<br />

(2) „Früher habe ich gedacht, Theater ist etwas Objektives, und man muss die<br />

Geschichte ganz von sich weghalten.“ (Neue Zürcher Zeitung)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!