Handbuch Digital Humanities
DH-Handbuch DH-Handbuch
ein Dateiformat zur plattformunabhängigen Darstellung von (mehrseitigen) Text- und Bilddateien. Gerade zur Gewährleistung der Nachnutzbarkeit von Daten, was im Rahmen eines Forschungsdatenzyklus ein zentrales Anliegen ist, kann das Dateiformat PDF also zu einer massiven Nutzungseinschränkung führen. Hier empfehlen sich alternative Dateiformate: Zum einen kann der Open Document (ODF) Standard für Office-Dokumente verwendet werden, für klassisch geisteswissenschaftliche Quellgattungen kann der TEI Standard und die darin angebotenen Anpassungen (en: Customizations) eine gute Alternative sein. Beide Empfehlungen gelten jedoch unter Vorbehalt, da viele weitere Verwendungszwecke von textbasierten Informationen möglich sind, welche von den genannten Empfehlungen nur unzureichend unterstützt werden. Insgesamt wird interessierten WissenschaftlerInnen für alle genannten Aspekte der Langzeitproblematik empfohlen, immer Nutzen und Aufwand zwischen den unterschiedlichen Optionen bei der Wahl von Dateiformaten abzuwägen. Das folgende Kapitel nennt dabei die wichtigsten Punkte, die es zu bedenken gilt. Handlungsbedarf und offene Forschungsfragen in der Langzeitarchivierung Das Problemfeld der Langzeitarchivierung stellt sowohl eine Herausforderung an Bibliothekare und Archivare aber auch an jeden Forschenden dar. Aus den oben geschilderten Aspekten ergibt sich schnell, dass hier kein einheitlicher Lösungsvorschlag unterbreitet werden kann. Es können aber einige Bereiche identifiziert werden, in denen WissenschaftlerInnen selbst Lösungsmöglichkeiten beeinflussen können: • Eine unvollständige Liste von Dateiformaten zählt bei Wikipedia aktuell 1316 gebräuchliche Dateiformate. 28 Diese unterscheiden sich augenscheinlich in allerlei Aspekten – sowohl was ihren Anwendungsbezug als auch ihre Dokumentationstiefe, ihre Verbreitung und weiteres betrifft. Hier kann die Library of Congress 68
wertvolle Empfehlungen geben. 29 Durch die Wahl des Dateiformats lässt sich das Problem der Formatobsoleszenz zumindest eingrenzen. Kriterien, wie die Verbreitung eines Dateiformats, seine Lizenzierung und Akzeptanz über eine Community hinaus sind ein wichtiger Maßstab, um dessen Langzeitarchivierungstauglichkeit beurteilen zu können. • Sollte es sich bei den desiderierten Forschungsdaten um Solche handeln, welche die Digitalisierung noch vor sich haben, sind unbedingt die Empfehlungen der DFG und des Wissenschaftsrats zu beachten. Generell ist es eine gute Idee, nicht unbedingt eigene Konventionen festzulegen, sondern bereits bestehende zu übernehmen. 30 • Die Frage nach der Datenablage nach Projektabschluss, sollte möglichst schon im Forschungsantrag beantwortet werden. Die verschiedenen Forschungsförderungsorganisationen machen gegebenenfalls auch Angaben zu erwünschtem Umfang und Form der abschließenden Aufbewahrung. Generell ist zu empfehlen, Forschungsdaten nicht nur lokal zu speichern, sondern Angebote des eigenen Rechenzentrums, der lokalen Hochschulbibliothek, aber auch landes- oder bundesweiter wissenschaftlicher Infrastrukturen anzunehmen. Hier gilt es auf die oben aufgeführten Kriterien zu achten: Werden die Daten redundant gespeichert? Werden Strategien zur Formaterkennung und -dokumentation angeboten? • Eine hinreichend umfangreiche deskriptive Beschreibung der eigenen Forschungsdaten in einem dafür vorgesehenen und verbreiteten Metadatenstandard ist immer zu empfehlen. Solche Metadaten können wertvolle Zusatzinformationen liefern und erleichtern das Auffinden und die Verknüpfung zu anderen Daten in einem System. Hier bieten sich die Standards der Library of Congress an. 31 Eine nicht vollständige aber umfangreiche Liste von möglichen Kriterien, die es hinsichtlich Langzeitarchivierungsfähigkeit und Nachnutzbarkeit der eigenen Forschungsdaten zu beachten gilt wurde außerdem im Rahmen von DARIAH-DE entwickelt. 32 69
- Page 17 and 18: Welche Tools haben Sie ausgewählt
- Page 19 and 20: essere Nutzerführung, andererseits
- Page 21 and 22: Allerdings bleibt zweierlei zu kons
- Page 23 and 24: europäischen und nord- sowie süda
- Page 25 and 26: Projekte, die große Datenmengen an
- Page 27 and 28: gesteuert über ein Suchinterface a
- Page 29 and 30: Bau- und Kunstgeschichte • Durch
- Page 31 and 32: diese Weise kann der Lageplan belie
- Page 33 and 34: grundlegende Überlegungen zur kogn
- Page 35 and 36: Masato Takami, Peter Bell and Björ
- Page 37 and 38: - vielleicht so wie für uns die Bi
- Page 39 and 40: Weitere Informationen zu den Projek
- Page 41 and 42: mitarbeiter an der Entwicklung des
- Page 43 and 44: Hannah Busch: Handschriften analysi
- Page 45 and 46: Warum wurden digitale Methoden gew
- Page 47 and 48: Weitere Links: http://www.ecodicolo
- Page 49 and 50: ARIADNE „Advanced Research Infras
- Page 51 and 52: Vom Datenberg zum Wissensfluss: Wie
- Page 53 and 54: Andorfer 5 zeigt im Zuge der Auswer
- Page 55 and 56: die maßgeblich zu Standardisierung
- Page 57 and 58: Kontrollierte Vokabulare Viel Aufme
- Page 59 and 60: Dateiformate Die Welt der Dateiform
- Page 61 and 62: Eine Übersicht über relevante Dat
- Page 63 and 64: und damit auch Darstellungsfehlern
- Page 65 and 66: aktuell ist, so sollte diese Datei
- Page 67: So können Links und Verweise in ei
- Page 71 and 72: http://www.europeana.eu http://www.
- Page 73 and 74: 15 Für weitere Informationen: http
- Page 75 and 76: mehr lizenzfrei. Für die Wissensch
- Page 77 and 78: Neue Möglichkeiten durch alternati
- Page 79 and 80: Creative Commons - Choose a License
- Page 81 and 82: In Deutschland und vielen anderen L
- Page 83 and 84: Rechtliche Bedingungen und Handlung
- Page 85 and 86: Methoden und Werkzeuge in den Digit
- Page 87 and 88: diese bewegt oder animiert, werden
- Page 89 and 90: gabe der Daten ist sehr einfach geh
- Page 91 and 92: tern, wie "und", "der" und "die". O
- Page 93 and 94: Die erste Achse dieses neuen Bezugs
- Page 95 and 96: Noch weiter lässt sich die Analyse
- Page 97 and 98: Euklidische Distanz verwendet. Empi
- Page 99 and 100: oder in einem Unixsystem "/home/Mei
- Page 101 and 102: im Koordinatensystem einer Gruppe z
- Page 103 and 104: ComputerlinguistInnen haben in den
- Page 105 and 106: erledigen, hier bietet sich zusätz
- Page 107 and 108: Abbildung 5.10: Baumdiagramm der St
- Page 109 and 110: S. Bock, K. Du, P. Dürholt, T. Gra
- Page 111 and 112: Forschungsinfrastrukturen nutzen Zi
- Page 113 and 114: Lösungen entwickelt und bereitgest
- Page 115 and 116: manities "on demand" und flexibel e
- Page 117 and 118: • Größe (von einigen wenigen Ki
ein Dateiformat zur plattformunabhängigen Darstellung von<br />
(mehrseitigen) Text- und Bilddateien. Gerade zur Gewährleistung<br />
der Nachnutzbarkeit von Daten, was im Rahmen eines<br />
Forschungsdatenzyklus ein zentrales Anliegen ist, kann das<br />
Dateiformat PDF also zu einer massiven Nutzungseinschränkung<br />
führen. Hier empfehlen sich alternative Dateiformate:<br />
Zum einen kann der Open Document (ODF) Standard für<br />
Office-Dokumente verwendet werden, für klassisch geisteswissenschaftliche<br />
Quellgattungen kann der TEI Standard und<br />
die darin angebotenen Anpassungen (en: Customizations)<br />
eine gute Alternative sein. Beide Empfehlungen gelten jedoch<br />
unter Vorbehalt, da viele weitere Verwendungszwecke von<br />
textbasierten Informationen möglich sind, welche von den<br />
genannten Empfehlungen nur unzureichend unterstützt werden.<br />
Insgesamt wird interessierten WissenschaftlerInnen für alle<br />
genannten Aspekte der Langzeitproblematik empfohlen, immer<br />
Nutzen und Aufwand zwischen den unterschiedlichen<br />
Optionen bei der Wahl von Dateiformaten abzuwägen. Das<br />
folgende Kapitel nennt dabei die wichtigsten Punkte, die es<br />
zu bedenken gilt.<br />
Handlungsbedarf und offene<br />
Forschungsfragen in der<br />
Langzeitarchivierung<br />
Das Problemfeld der Langzeitarchivierung stellt sowohl eine<br />
Herausforderung an Bibliothekare und Archivare aber auch<br />
an jeden Forschenden dar. Aus den oben geschilderten Aspekten<br />
ergibt sich schnell, dass hier kein einheitlicher Lösungsvorschlag<br />
unterbreitet werden kann. Es können aber<br />
einige Bereiche identifiziert werden, in denen WissenschaftlerInnen<br />
selbst Lösungsmöglichkeiten beeinflussen können:<br />
• Eine unvollständige Liste von Dateiformaten zählt bei Wikipedia<br />
aktuell 1316 gebräuchliche Dateiformate. 28 Diese unterscheiden<br />
sich augenscheinlich in allerlei Aspekten – sowohl was ihren<br />
Anwendungsbezug als auch ihre Dokumentationstiefe, ihre Verbreitung<br />
und weiteres betrifft. Hier kann die Library of Congress<br />
68