02.12.2012 Aufrufe

Archiving websites Archivierungskonzept für das Intranet der Dresdner

Archiving websites Archivierungskonzept für das Intranet der Dresdner

Archiving websites Archivierungskonzept für das Intranet der Dresdner

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Ablauf <strong>der</strong> Archivierung<br />

2. Verwendung von „Web crawlers“ zur vollständigen Archivierung<br />

des <strong>Intranet</strong>s<br />

„The goal is to collect everything on the Internet by means of<br />

automatic software.“ 74<br />

Die „Web crawlers“ ermöglichen <strong>das</strong> vollständige, automatische<br />

Archivieren von bestimmten Webbereichen 75 . Sie finden vorwiegend<br />

Anwendung bei Projekten 76 , die <strong>das</strong> Ziel verfolgen, <strong>das</strong> gesamte Web, o<strong>der</strong><br />

einen bestimmten Bereich des Webs bzw. eine bestimmte Top-Level-<br />

Domäne 77 , „vollständig“ und regelmäßig zu archivieren. 78<br />

Ich teile die Meinung von Julien Masanès und sehe „Web crawler“ als nicht<br />

geeignet an, um einzelne, individuelle Websites zu archivieren und die<br />

Archivierungsfrequenz anzupassen. Denn einmal müssen <strong>für</strong> den Einsatz<br />

bestimmte Begriffe, Themen o<strong>der</strong> Pfadnamen ausgewählt werden, die den<br />

Wert einer historischen Überlieferung entsprechen könnten. Im Fall des<br />

<strong>Intranet</strong>s <strong>der</strong> <strong>Dresdner</strong> Bank ist dies sehr schwierig, da es thematisch nicht<br />

überschaubar ist und eine Vielzahl an Pfadnamen enthält, die<br />

eingeschlossen werden müssten. Die Gefahr wichtige Informationen zu<br />

verlieren, die nicht dem definierten Raum entsprechen, wäre sehr hoch.<br />

Es könne aber auch die URL des <strong>Intranet</strong>portals eingegeben werden. Von<br />

diesem Pfadnamen aus würden alle weiterführenden URLs weiterverfolgt<br />

kopiert und heruntergeladen werden. Die Grenze zwischen <strong>Intranet</strong> und<br />

Internet könne nicht eingehalten werden, da einige <strong>Intranet</strong>seiten Links zu<br />

Internetauftritten aufweisen, z. B. Online-Publikationen. Die fehlenden F<br />

Filtermöglichkeiten stellen ein weiteres Problem dar, denn aus archivischer<br />

Sicht sind nicht alle aufrufbaren Informationen archivwürdig 79 .<br />

Nachteilig ist ferner, <strong>das</strong>s die Dauer des „Erntens“ nicht abzuschätzen ist.<br />

Denn <strong>der</strong> Kopiervorgang wird erst abgebrochen, wenn alle Dateien aus dem<br />

74 Vgl. Arms, Minerva, 2001.<br />

75 Vgl. Hakala, NEDLIB, 2001.<br />

76 Vgl. Tab. 1 – Projekte: „The Internet Archive“, „Kulturarw3“, „EWA“, „NWA“.<br />

77 Zum Beispiel: .se <strong>für</strong> Schweden, .fr <strong>für</strong> Frankreich, .com<br />

78 Vgl. Lyman, <strong>Archiving</strong> WWW, 2002.<br />

79 Vgl. Kapitel „Bewertung“.<br />

32

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!