Archiving websites Archivierungskonzept für das Intranet der Dresdner

Archiving websites Archivierungskonzept für das Intranet der Dresdner Archiving websites Archivierungskonzept für das Intranet der Dresdner

forge.fh.potsdam.de
von forge.fh.potsdam.de Mehr von diesem Publisher
02.12.2012 Aufrufe

Ablauf der Archivierung 2. Verwendung von „Web crawlers“ zur vollständigen Archivierung des Intranets „The goal is to collect everything on the Internet by means of automatic software.“ 74 Die „Web crawlers“ ermöglichen das vollständige, automatische Archivieren von bestimmten Webbereichen 75 . Sie finden vorwiegend Anwendung bei Projekten 76 , die das Ziel verfolgen, das gesamte Web, oder einen bestimmten Bereich des Webs bzw. eine bestimmte Top-Level- Domäne 77 , „vollständig“ und regelmäßig zu archivieren. 78 Ich teile die Meinung von Julien Masanès und sehe „Web crawler“ als nicht geeignet an, um einzelne, individuelle Websites zu archivieren und die Archivierungsfrequenz anzupassen. Denn einmal müssen für den Einsatz bestimmte Begriffe, Themen oder Pfadnamen ausgewählt werden, die den Wert einer historischen Überlieferung entsprechen könnten. Im Fall des Intranets der Dresdner Bank ist dies sehr schwierig, da es thematisch nicht überschaubar ist und eine Vielzahl an Pfadnamen enthält, die eingeschlossen werden müssten. Die Gefahr wichtige Informationen zu verlieren, die nicht dem definierten Raum entsprechen, wäre sehr hoch. Es könne aber auch die URL des Intranetportals eingegeben werden. Von diesem Pfadnamen aus würden alle weiterführenden URLs weiterverfolgt kopiert und heruntergeladen werden. Die Grenze zwischen Intranet und Internet könne nicht eingehalten werden, da einige Intranetseiten Links zu Internetauftritten aufweisen, z. B. Online-Publikationen. Die fehlenden F Filtermöglichkeiten stellen ein weiteres Problem dar, denn aus archivischer Sicht sind nicht alle aufrufbaren Informationen archivwürdig 79 . Nachteilig ist ferner, dass die Dauer des „Erntens“ nicht abzuschätzen ist. Denn der Kopiervorgang wird erst abgebrochen, wenn alle Dateien aus dem 74 Vgl. Arms, Minerva, 2001. 75 Vgl. Hakala, NEDLIB, 2001. 76 Vgl. Tab. 1 – Projekte: „The Internet Archive“, „Kulturarw3“, „EWA“, „NWA“. 77 Zum Beispiel: .se für Schweden, .fr für Frankreich, .com 78 Vgl. Lyman, Archiving WWW, 2002. 79 Vgl. Kapitel „Bewertung“. 32

Ablauf der Archivierung definierten Bereich gefunden wurden. Schwierig gestaltet sich zudem die Darstellung des Ergebnisses. Alle gefundenen Informationen werden in einem Ranking angezeigt und würden nicht in ihrem ursprünglichen Zusammenhang des Intranets stehen. Das widerspricht dem Ansatz zur Archivierung von digitalen Aufzeichnungen, deren Inhalt, Kontextinformationen und strukturelle Zusammenhänge zu erhalten 80 . 3. Verwendung einer Spiegelungssoftware zur selektiven Archivierung des Intranets „… there is the selective approach where documents deemed worthy of preservation are selected by humans.“ 81 Bei einer auswählenden Herangehensweise werden archivwürdige Dokumente durch die intellektuelle Bewertung für die Archivierung mittels einer Spiegelungssoftware ausgewählt. Dieses Vorgehensweise eignet sich, um den Archivierungsbereich bereits ausgewählte Websites einzugrenzen 82 . Mit der Software werden alle Dateien einer URL bis in eine bestimmte Verzeichnungsstufe kopiert und heruntergeladen. Es können verschiedene Filtereinstellungen vorgenommen werden. Die Spiegelung dauert nur wenige Minuten. Nachteilig ist, dass es mit der Software schwer möglich sein wird, umfangreiche Websites vollständig zu archivieren. Eine Spiegelung ist nicht geeignet für Websites mit interaktiven und überwiegend dynamischen Webseiten. Während der Untersuchung und Testphase für die Archivierung des Intranets im Februar 2003 schien für das Intranet die auswählende Herangehensweise mit einer Spiegelungssoftware am geeignetsten. Aus 80 „The preservation of electronic records poses new and demanding challenges for archivists [...] for records to srve as evidence, the content, context and structure of the records - which in the electronic environment are independent of the medium – must be retained. („Records Preservation“ in:: ICA, Guide, 1997) 81 Arvison, Kulturarw3Project, 2000. 82 “A selective approach based on pre-selection, capture and cataloguing of individual Web sites.” (Masanès, Web Archiving, 2002) 33

Ablauf <strong>der</strong> Archivierung<br />

definierten Bereich gefunden wurden. Schwierig gestaltet sich zudem die<br />

Darstellung des Ergebnisses. Alle gefundenen Informationen werden in<br />

einem Ranking angezeigt und würden nicht in ihrem ursprünglichen<br />

Zusammenhang des <strong>Intranet</strong>s stehen. Das wi<strong>der</strong>spricht dem Ansatz zur<br />

Archivierung von digitalen Aufzeichnungen, <strong>der</strong>en Inhalt,<br />

Kontextinformationen und strukturelle Zusammenhänge zu erhalten 80 .<br />

3. Verwendung einer Spiegelungssoftware zur selektiven<br />

Archivierung des <strong>Intranet</strong>s<br />

„… there is the selective approach where documents deemed<br />

worthy of preservation are selected by humans.“ 81<br />

Bei einer auswählenden Herangehensweise werden archivwürdige<br />

Dokumente durch die intellektuelle Bewertung <strong>für</strong> die Archivierung mittels<br />

einer Spiegelungssoftware ausgewählt. Dieses Vorgehensweise eignet sich,<br />

um den Archivierungsbereich bereits ausgewählte Websites einzugrenzen 82 .<br />

Mit <strong>der</strong> Software werden alle Dateien einer URL bis in eine bestimmte<br />

Verzeichnungsstufe kopiert und heruntergeladen. Es können verschiedene<br />

Filtereinstellungen vorgenommen werden. Die Spiegelung dauert nur<br />

wenige Minuten.<br />

Nachteilig ist, <strong>das</strong>s es mit <strong>der</strong> Software schwer möglich sein wird,<br />

umfangreiche Websites vollständig zu archivieren. Eine Spiegelung ist nicht<br />

geeignet <strong>für</strong> Websites mit interaktiven und überwiegend dynamischen<br />

Webseiten.<br />

Während <strong>der</strong> Untersuchung und Testphase <strong>für</strong> die Archivierung des<br />

<strong>Intranet</strong>s im Februar 2003 schien <strong>für</strong> <strong>das</strong> <strong>Intranet</strong> die auswählende<br />

Herangehensweise mit einer Spiegelungssoftware am geeignetsten. Aus<br />

80 „The preservation of electronic records poses new and demanding challenges for<br />

archivists [...] for records to srve as evidence, the content, context and structure of the<br />

records - which in the electronic environment are independent of the medium – must be<br />

retained. („Records Preservation“ in:: ICA, Guide, 1997)<br />

81 Arvison, Kulturarw3Project, 2000.<br />

82 “A selective approach based on pre-selection, capture and cataloguing of individual Web<br />

sites.” (Masanès, Web <strong>Archiving</strong>, 2002)<br />

33

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!