31.10.2015 Views

Handbuch Digital Humanities

DH-Handbuch

DH-Handbuch

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

die maßgeblich zu Standardisierungen und einer interdisziplinären<br />

Interoperabilität beigetragen haben. Trotz dieser<br />

Einschränkungen ist erkennbar, dass auch bei den zuletzt genannten<br />

Disziplinen eine stärkere Verwendung von Normdaten,<br />

wie beispielsweise des Thesaurus of Geographic Names<br />

(TGN) oder der Gemeinsamen Normdatei (GND), erkennbar ist<br />

und diese Entwicklungen auch auf Dauer unterstützt werden<br />

sollten.<br />

Zur Notwendigkeit semantischer Auszeichnungen<br />

Eine Maschine dürfte Schwierigkeiten haben, im folgenden<br />

Satz „Hans Hamburger genießt in Paris einen Berliner“ Ortsnamen<br />

von Personennamen und populären Speisen zu unterscheiden.<br />

Beißt Hans Hamburger in Paris/Frankreich oder<br />

in Paris/Texas in die Süßspeise? Hier könnte eine Spezifizierung<br />

über den Getty Thesaurus of Geographic Names für<br />

geographische Präzisierung sorgen. Gleiches gilt für Hans<br />

Hamburger, denn immerhin gibt es drei Personen dieses<br />

Namens mit je eigener Identifikator (ID) in der Gemeinsamen<br />

Normdatei (GND) der deutschen Nationalbibliothek und diese<br />

gilt es dann zu spezifizieren. Und um auszuschließen, dass<br />

mit „Berliner“ Kennedys „Ik bin ein Berliner“ assoziiert wird,<br />

könnte durch Hinweis auf Kategorie 642 „Mahlzeiten und<br />

Tischkultur“ der Deweyschen Decimal Classification auf die<br />

Backware hingewiesen werden.<br />

Eine einfache Suche bei Wikipedia kann ebenfalls die Unklarheiten<br />

bzw. Probleme veranschaulichen, die beim Text-Mining<br />

und dem Matching auf bestimmte Vokabulare entstehen<br />

– zum Beispiel bei der Erkennung von Homonymen; siehe<br />

dazu etwa die Begriffsklärung zu „London“ in der deutschsprachigen<br />

Wikipedia. 7<br />

Datenqualität<br />

Die Qualität der Daten bestimmt maßgeblich, inwiefern diese<br />

für die Forschung nutzbar und nachnutzbar sind.<br />

So kann die Auflösung von Bilddaten für die Beantwortung einiger<br />

Forschungsfragen sehr entscheidend sein, während für<br />

die Beantwortung anderer Forschungsfragen beispielsweise<br />

55

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!