Handbuch Digital Humanities

DH-Handbuch DH-Handbuch

31.10.2015 Views

ein Dateiformat zur plattformunabhängigen Darstellung von (mehrseitigen) Text- und Bilddateien. Gerade zur Gewährleistung der Nachnutzbarkeit von Daten, was im Rahmen eines Forschungsdatenzyklus ein zentrales Anliegen ist, kann das Dateiformat PDF also zu einer massiven Nutzungseinschränkung führen. Hier empfehlen sich alternative Dateiformate: Zum einen kann der Open Document (ODF) Standard für Office-Dokumente verwendet werden, für klassisch geisteswissenschaftliche Quellgattungen kann der TEI Standard und die darin angebotenen Anpassungen (en: Customizations) eine gute Alternative sein. Beide Empfehlungen gelten jedoch unter Vorbehalt, da viele weitere Verwendungszwecke von textbasierten Informationen möglich sind, welche von den genannten Empfehlungen nur unzureichend unterstützt werden. Insgesamt wird interessierten WissenschaftlerInnen für alle genannten Aspekte der Langzeitproblematik empfohlen, immer Nutzen und Aufwand zwischen den unterschiedlichen Optionen bei der Wahl von Dateiformaten abzuwägen. Das folgende Kapitel nennt dabei die wichtigsten Punkte, die es zu bedenken gilt. Handlungsbedarf und offene Forschungsfragen in der Langzeitarchivierung Das Problemfeld der Langzeitarchivierung stellt sowohl eine Herausforderung an Bibliothekare und Archivare aber auch an jeden Forschenden dar. Aus den oben geschilderten Aspekten ergibt sich schnell, dass hier kein einheitlicher Lösungsvorschlag unterbreitet werden kann. Es können aber einige Bereiche identifiziert werden, in denen WissenschaftlerInnen selbst Lösungsmöglichkeiten beeinflussen können: • Eine unvollständige Liste von Dateiformaten zählt bei Wikipedia aktuell 1316 gebräuchliche Dateiformate. 28 Diese unterscheiden sich augenscheinlich in allerlei Aspekten – sowohl was ihren Anwendungsbezug als auch ihre Dokumentationstiefe, ihre Verbreitung und weiteres betrifft. Hier kann die Library of Congress 68

wertvolle Empfehlungen geben. 29 Durch die Wahl des Dateiformats lässt sich das Problem der Formatobsoleszenz zumindest eingrenzen. Kriterien, wie die Verbreitung eines Dateiformats, seine Lizenzierung und Akzeptanz über eine Community hinaus sind ein wichtiger Maßstab, um dessen Langzeitarchivierungstauglichkeit beurteilen zu können. • Sollte es sich bei den desiderierten Forschungsdaten um Solche handeln, welche die Digitalisierung noch vor sich haben, sind unbedingt die Empfehlungen der DFG und des Wissenschaftsrats zu beachten. Generell ist es eine gute Idee, nicht unbedingt eigene Konventionen festzulegen, sondern bereits bestehende zu übernehmen. 30 • Die Frage nach der Datenablage nach Projektabschluss, sollte möglichst schon im Forschungsantrag beantwortet werden. Die verschiedenen Forschungsförderungsorganisationen machen gegebenenfalls auch Angaben zu erwünschtem Umfang und Form der abschließenden Aufbewahrung. Generell ist zu empfehlen, Forschungsdaten nicht nur lokal zu speichern, sondern Angebote des eigenen Rechenzentrums, der lokalen Hochschulbibliothek, aber auch landes- oder bundesweiter wissenschaftlicher Infrastrukturen anzunehmen. Hier gilt es auf die oben aufgeführten Kriterien zu achten: Werden die Daten redundant gespeichert? Werden Strategien zur Formaterkennung und -dokumentation angeboten? • Eine hinreichend umfangreiche deskriptive Beschreibung der eigenen Forschungsdaten in einem dafür vorgesehenen und verbreiteten Metadatenstandard ist immer zu empfehlen. Solche Metadaten können wertvolle Zusatzinformationen liefern und erleichtern das Auffinden und die Verknüpfung zu anderen Daten in einem System. Hier bieten sich die Standards der Library of Congress an. 31 Eine nicht vollständige aber umfangreiche Liste von möglichen Kriterien, die es hinsichtlich Langzeitarchivierungsfähigkeit und Nachnutzbarkeit der eigenen Forschungsdaten zu beachten gilt wurde außerdem im Rahmen von DARIAH-DE entwickelt. 32 69

ein Dateiformat zur plattformunabhängigen Darstellung von<br />

(mehrseitigen) Text- und Bilddateien. Gerade zur Gewährleistung<br />

der Nachnutzbarkeit von Daten, was im Rahmen eines<br />

Forschungsdatenzyklus ein zentrales Anliegen ist, kann das<br />

Dateiformat PDF also zu einer massiven Nutzungseinschränkung<br />

führen. Hier empfehlen sich alternative Dateiformate:<br />

Zum einen kann der Open Document (ODF) Standard für<br />

Office-Dokumente verwendet werden, für klassisch geisteswissenschaftliche<br />

Quellgattungen kann der TEI Standard und<br />

die darin angebotenen Anpassungen (en: Customizations)<br />

eine gute Alternative sein. Beide Empfehlungen gelten jedoch<br />

unter Vorbehalt, da viele weitere Verwendungszwecke von<br />

textbasierten Informationen möglich sind, welche von den<br />

genannten Empfehlungen nur unzureichend unterstützt werden.<br />

Insgesamt wird interessierten WissenschaftlerInnen für alle<br />

genannten Aspekte der Langzeitproblematik empfohlen, immer<br />

Nutzen und Aufwand zwischen den unterschiedlichen<br />

Optionen bei der Wahl von Dateiformaten abzuwägen. Das<br />

folgende Kapitel nennt dabei die wichtigsten Punkte, die es<br />

zu bedenken gilt.<br />

Handlungsbedarf und offene<br />

Forschungsfragen in der<br />

Langzeitarchivierung<br />

Das Problemfeld der Langzeitarchivierung stellt sowohl eine<br />

Herausforderung an Bibliothekare und Archivare aber auch<br />

an jeden Forschenden dar. Aus den oben geschilderten Aspekten<br />

ergibt sich schnell, dass hier kein einheitlicher Lösungsvorschlag<br />

unterbreitet werden kann. Es können aber<br />

einige Bereiche identifiziert werden, in denen WissenschaftlerInnen<br />

selbst Lösungsmöglichkeiten beeinflussen können:<br />

• Eine unvollständige Liste von Dateiformaten zählt bei Wikipedia<br />

aktuell 1316 gebräuchliche Dateiformate. 28 Diese unterscheiden<br />

sich augenscheinlich in allerlei Aspekten – sowohl was ihren<br />

Anwendungsbezug als auch ihre Dokumentationstiefe, ihre Verbreitung<br />

und weiteres betrifft. Hier kann die Library of Congress<br />

68

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!