Handbuch Digital Humanities

DH-Handbuch DH-Handbuch

31.10.2015 Views

Die Abbildung zeigt den entwickelten Research Data Life Cycle, die verschiedenen Arbeitsschritte, die daraus resultierenden Datenformate und die Voraussetzungen für eine Nachnutzung und Langzeitarchivierung der Daten. Aus Masse mach Klasse - aber wie? Interoperabilität durch Standardisierung In einigen geisteswissenschaftlichen Fachdisziplinen haben sich in den vergangenen Jahren fachspezifische nationale und international angewandte Standards herausgebildet, mit denen bestimmte Kategorien von Forschungsdaten, Forschungsobjekten oder auch Forschungsprozessen beschrieben werden können. Festzustellen ist auch, dass sich bei einer Vielzahl von Editionsprojekten – unabhängig von ihrer disziplinären Verortung – solche Standardisierungsprozesse herausgebildet haben. So sind hier an erster Stelle die Text Encoding Initiative (TEI) mit einem internationalen Spektrum oder auch das deutsche Projekt TextGrid zu nennen, die maßgeblich zu einheitlicheren Verfahren beitrugen. Als weiterer Aspekt ist zu nennen, dass in der Vergangenheit von Seiten der Drittmittelgeber für ausschließlich inhaltlich orientierte und ausgerichtete Forschungsprojekte die Erfassung und Erschließung des verwendeten Quellenmaterials mit standardisierten Metadaten nicht explizit gefördert wurden. Aber auch hier sind in den letzten Jahren beispielsweise durch das Förderprogramm für wissenschaftliche Literaturversorgungs- und Informationssysteme (LIS) der Deutschen Forschungsgemeinschaft Empfehlungen entwickelt worden, 54

die maßgeblich zu Standardisierungen und einer interdisziplinären Interoperabilität beigetragen haben. Trotz dieser Einschränkungen ist erkennbar, dass auch bei den zuletzt genannten Disziplinen eine stärkere Verwendung von Normdaten, wie beispielsweise des Thesaurus of Geographic Names (TGN) oder der Gemeinsamen Normdatei (GND), erkennbar ist und diese Entwicklungen auch auf Dauer unterstützt werden sollten. Zur Notwendigkeit semantischer Auszeichnungen Eine Maschine dürfte Schwierigkeiten haben, im folgenden Satz „Hans Hamburger genießt in Paris einen Berliner“ Ortsnamen von Personennamen und populären Speisen zu unterscheiden. Beißt Hans Hamburger in Paris/Frankreich oder in Paris/Texas in die Süßspeise? Hier könnte eine Spezifizierung über den Getty Thesaurus of Geographic Names für geographische Präzisierung sorgen. Gleiches gilt für Hans Hamburger, denn immerhin gibt es drei Personen dieses Namens mit je eigener Identifikator (ID) in der Gemeinsamen Normdatei (GND) der deutschen Nationalbibliothek und diese gilt es dann zu spezifizieren. Und um auszuschließen, dass mit „Berliner“ Kennedys „Ik bin ein Berliner“ assoziiert wird, könnte durch Hinweis auf Kategorie 642 „Mahlzeiten und Tischkultur“ der Deweyschen Decimal Classification auf die Backware hingewiesen werden. Eine einfache Suche bei Wikipedia kann ebenfalls die Unklarheiten bzw. Probleme veranschaulichen, die beim Text-Mining und dem Matching auf bestimmte Vokabulare entstehen – zum Beispiel bei der Erkennung von Homonymen; siehe dazu etwa die Begriffsklärung zu „London“ in der deutschsprachigen Wikipedia. 7 Datenqualität Die Qualität der Daten bestimmt maßgeblich, inwiefern diese für die Forschung nutzbar und nachnutzbar sind. So kann die Auflösung von Bilddaten für die Beantwortung einiger Forschungsfragen sehr entscheidend sein, während für die Beantwortung anderer Forschungsfragen beispielsweise 55

Die Abbildung zeigt den entwickelten Research Data<br />

Life Cycle, die verschiedenen Arbeitsschritte, die daraus<br />

resultierenden Datenformate und die Voraussetzungen für<br />

eine Nachnutzung und Langzeitarchivierung der Daten.<br />

Aus Masse mach Klasse - aber<br />

wie? Interoperabilität durch<br />

Standardisierung<br />

In einigen geisteswissenschaftlichen Fachdisziplinen haben<br />

sich in den vergangenen Jahren fachspezifische nationale<br />

und international angewandte Standards herausgebildet,<br />

mit denen bestimmte Kategorien von Forschungsdaten, Forschungsobjekten<br />

oder auch Forschungsprozessen beschrieben<br />

werden können. Festzustellen ist auch, dass sich bei<br />

einer Vielzahl von Editionsprojekten – unabhängig von ihrer<br />

disziplinären Verortung – solche Standardisierungsprozesse<br />

herausgebildet haben. So sind hier an erster Stelle die Text<br />

Encoding Initiative (TEI) mit einem internationalen Spektrum<br />

oder auch das deutsche Projekt TextGrid zu nennen, die<br />

maßgeblich zu einheitlicheren Verfahren beitrugen.<br />

Als weiterer Aspekt ist zu nennen, dass in der Vergangenheit<br />

von Seiten der Drittmittelgeber für ausschließlich inhaltlich<br />

orientierte und ausgerichtete Forschungsprojekte die Erfassung<br />

und Erschließung des verwendeten Quellenmaterials<br />

mit standardisierten Metadaten nicht explizit gefördert wurden.<br />

Aber auch hier sind in den letzten Jahren beispielsweise<br />

durch das Förderprogramm für wissenschaftliche Literaturversorgungs-<br />

und Informationssysteme (LIS) der Deutschen<br />

Forschungsgemeinschaft Empfehlungen entwickelt worden,<br />

54

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!