Handbuch Digital Humanities
DH-Handbuch DH-Handbuch
Die Abbildung zeigt den entwickelten Research Data Life Cycle, die verschiedenen Arbeitsschritte, die daraus resultierenden Datenformate und die Voraussetzungen für eine Nachnutzung und Langzeitarchivierung der Daten. Aus Masse mach Klasse - aber wie? Interoperabilität durch Standardisierung In einigen geisteswissenschaftlichen Fachdisziplinen haben sich in den vergangenen Jahren fachspezifische nationale und international angewandte Standards herausgebildet, mit denen bestimmte Kategorien von Forschungsdaten, Forschungsobjekten oder auch Forschungsprozessen beschrieben werden können. Festzustellen ist auch, dass sich bei einer Vielzahl von Editionsprojekten – unabhängig von ihrer disziplinären Verortung – solche Standardisierungsprozesse herausgebildet haben. So sind hier an erster Stelle die Text Encoding Initiative (TEI) mit einem internationalen Spektrum oder auch das deutsche Projekt TextGrid zu nennen, die maßgeblich zu einheitlicheren Verfahren beitrugen. Als weiterer Aspekt ist zu nennen, dass in der Vergangenheit von Seiten der Drittmittelgeber für ausschließlich inhaltlich orientierte und ausgerichtete Forschungsprojekte die Erfassung und Erschließung des verwendeten Quellenmaterials mit standardisierten Metadaten nicht explizit gefördert wurden. Aber auch hier sind in den letzten Jahren beispielsweise durch das Förderprogramm für wissenschaftliche Literaturversorgungs- und Informationssysteme (LIS) der Deutschen Forschungsgemeinschaft Empfehlungen entwickelt worden, 54
die maßgeblich zu Standardisierungen und einer interdisziplinären Interoperabilität beigetragen haben. Trotz dieser Einschränkungen ist erkennbar, dass auch bei den zuletzt genannten Disziplinen eine stärkere Verwendung von Normdaten, wie beispielsweise des Thesaurus of Geographic Names (TGN) oder der Gemeinsamen Normdatei (GND), erkennbar ist und diese Entwicklungen auch auf Dauer unterstützt werden sollten. Zur Notwendigkeit semantischer Auszeichnungen Eine Maschine dürfte Schwierigkeiten haben, im folgenden Satz „Hans Hamburger genießt in Paris einen Berliner“ Ortsnamen von Personennamen und populären Speisen zu unterscheiden. Beißt Hans Hamburger in Paris/Frankreich oder in Paris/Texas in die Süßspeise? Hier könnte eine Spezifizierung über den Getty Thesaurus of Geographic Names für geographische Präzisierung sorgen. Gleiches gilt für Hans Hamburger, denn immerhin gibt es drei Personen dieses Namens mit je eigener Identifikator (ID) in der Gemeinsamen Normdatei (GND) der deutschen Nationalbibliothek und diese gilt es dann zu spezifizieren. Und um auszuschließen, dass mit „Berliner“ Kennedys „Ik bin ein Berliner“ assoziiert wird, könnte durch Hinweis auf Kategorie 642 „Mahlzeiten und Tischkultur“ der Deweyschen Decimal Classification auf die Backware hingewiesen werden. Eine einfache Suche bei Wikipedia kann ebenfalls die Unklarheiten bzw. Probleme veranschaulichen, die beim Text-Mining und dem Matching auf bestimmte Vokabulare entstehen – zum Beispiel bei der Erkennung von Homonymen; siehe dazu etwa die Begriffsklärung zu „London“ in der deutschsprachigen Wikipedia. 7 Datenqualität Die Qualität der Daten bestimmt maßgeblich, inwiefern diese für die Forschung nutzbar und nachnutzbar sind. So kann die Auflösung von Bilddaten für die Beantwortung einiger Forschungsfragen sehr entscheidend sein, während für die Beantwortung anderer Forschungsfragen beispielsweise 55
- Page 3 and 4: Inhaltsverzeichnis 1 1.1 1.2 1.3 1.
- Page 5 and 6: 6 6.1 6.2 6.2.1 6.2.2 6.2.3 6.2.4 6
- Page 7 and 8: Was sind die Digital Humanities? Be
- Page 9 and 10: Ein Beispiel für eine Methode der
- Page 11 and 12: Weitere Forschungsfragen, die mit M
- Page 13 and 14: Folgende Personen sind mit Intervie
- Page 15 and 16: Digital Humanities in der Praxis Um
- Page 17 and 18: Welche Tools haben Sie ausgewählt
- Page 19 and 20: essere Nutzerführung, andererseits
- Page 21 and 22: Allerdings bleibt zweierlei zu kons
- Page 23 and 24: europäischen und nord- sowie süda
- Page 25 and 26: Projekte, die große Datenmengen an
- Page 27 and 28: gesteuert über ein Suchinterface a
- Page 29 and 30: Bau- und Kunstgeschichte • Durch
- Page 31 and 32: diese Weise kann der Lageplan belie
- Page 33 and 34: grundlegende Überlegungen zur kogn
- Page 35 and 36: Masato Takami, Peter Bell and Björ
- Page 37 and 38: - vielleicht so wie für uns die Bi
- Page 39 and 40: Weitere Informationen zu den Projek
- Page 41 and 42: mitarbeiter an der Entwicklung des
- Page 43 and 44: Hannah Busch: Handschriften analysi
- Page 45 and 46: Warum wurden digitale Methoden gew
- Page 47 and 48: Weitere Links: http://www.ecodicolo
- Page 49 and 50: ARIADNE „Advanced Research Infras
- Page 51 and 52: Vom Datenberg zum Wissensfluss: Wie
- Page 53: Andorfer 5 zeigt im Zuge der Auswer
- Page 57 and 58: Kontrollierte Vokabulare Viel Aufme
- Page 59 and 60: Dateiformate Die Welt der Dateiform
- Page 61 and 62: Eine Übersicht über relevante Dat
- Page 63 and 64: und damit auch Darstellungsfehlern
- Page 65 and 66: aktuell ist, so sollte diese Datei
- Page 67 and 68: So können Links und Verweise in ei
- Page 69 and 70: wertvolle Empfehlungen geben. 29 Du
- Page 71 and 72: http://www.europeana.eu http://www.
- Page 73 and 74: 15 Für weitere Informationen: http
- Page 75 and 76: mehr lizenzfrei. Für die Wissensch
- Page 77 and 78: Neue Möglichkeiten durch alternati
- Page 79 and 80: Creative Commons - Choose a License
- Page 81 and 82: In Deutschland und vielen anderen L
- Page 83 and 84: Rechtliche Bedingungen und Handlung
- Page 85 and 86: Methoden und Werkzeuge in den Digit
- Page 87 and 88: diese bewegt oder animiert, werden
- Page 89 and 90: gabe der Daten ist sehr einfach geh
- Page 91 and 92: tern, wie "und", "der" und "die". O
- Page 93 and 94: Die erste Achse dieses neuen Bezugs
- Page 95 and 96: Noch weiter lässt sich die Analyse
- Page 97 and 98: Euklidische Distanz verwendet. Empi
- Page 99 and 100: oder in einem Unixsystem "/home/Mei
- Page 101 and 102: im Koordinatensystem einer Gruppe z
- Page 103 and 104: ComputerlinguistInnen haben in den
Die Abbildung zeigt den entwickelten Research Data<br />
Life Cycle, die verschiedenen Arbeitsschritte, die daraus<br />
resultierenden Datenformate und die Voraussetzungen für<br />
eine Nachnutzung und Langzeitarchivierung der Daten.<br />
Aus Masse mach Klasse - aber<br />
wie? Interoperabilität durch<br />
Standardisierung<br />
In einigen geisteswissenschaftlichen Fachdisziplinen haben<br />
sich in den vergangenen Jahren fachspezifische nationale<br />
und international angewandte Standards herausgebildet,<br />
mit denen bestimmte Kategorien von Forschungsdaten, Forschungsobjekten<br />
oder auch Forschungsprozessen beschrieben<br />
werden können. Festzustellen ist auch, dass sich bei<br />
einer Vielzahl von Editionsprojekten – unabhängig von ihrer<br />
disziplinären Verortung – solche Standardisierungsprozesse<br />
herausgebildet haben. So sind hier an erster Stelle die Text<br />
Encoding Initiative (TEI) mit einem internationalen Spektrum<br />
oder auch das deutsche Projekt TextGrid zu nennen, die<br />
maßgeblich zu einheitlicheren Verfahren beitrugen.<br />
Als weiterer Aspekt ist zu nennen, dass in der Vergangenheit<br />
von Seiten der Drittmittelgeber für ausschließlich inhaltlich<br />
orientierte und ausgerichtete Forschungsprojekte die Erfassung<br />
und Erschließung des verwendeten Quellenmaterials<br />
mit standardisierten Metadaten nicht explizit gefördert wurden.<br />
Aber auch hier sind in den letzten Jahren beispielsweise<br />
durch das Förderprogramm für wissenschaftliche Literaturversorgungs-<br />
und Informationssysteme (LIS) der Deutschen<br />
Forschungsgemeinschaft Empfehlungen entwickelt worden,<br />
54