Archiving websites Archivierungskonzept für das Intranet der Dresdner
Archiving websites Archivierungskonzept für das Intranet der Dresdner Archiving websites Archivierungskonzept für das Intranet der Dresdner
Ablauf der Archivierung 2. Verwendung von „Web crawlers“ zur vollständigen Archivierung des Intranets „The goal is to collect everything on the Internet by means of automatic software.“ 74 Die „Web crawlers“ ermöglichen das vollständige, automatische Archivieren von bestimmten Webbereichen 75 . Sie finden vorwiegend Anwendung bei Projekten 76 , die das Ziel verfolgen, das gesamte Web, oder einen bestimmten Bereich des Webs bzw. eine bestimmte Top-Level- Domäne 77 , „vollständig“ und regelmäßig zu archivieren. 78 Ich teile die Meinung von Julien Masanès und sehe „Web crawler“ als nicht geeignet an, um einzelne, individuelle Websites zu archivieren und die Archivierungsfrequenz anzupassen. Denn einmal müssen für den Einsatz bestimmte Begriffe, Themen oder Pfadnamen ausgewählt werden, die den Wert einer historischen Überlieferung entsprechen könnten. Im Fall des Intranets der Dresdner Bank ist dies sehr schwierig, da es thematisch nicht überschaubar ist und eine Vielzahl an Pfadnamen enthält, die eingeschlossen werden müssten. Die Gefahr wichtige Informationen zu verlieren, die nicht dem definierten Raum entsprechen, wäre sehr hoch. Es könne aber auch die URL des Intranetportals eingegeben werden. Von diesem Pfadnamen aus würden alle weiterführenden URLs weiterverfolgt kopiert und heruntergeladen werden. Die Grenze zwischen Intranet und Internet könne nicht eingehalten werden, da einige Intranetseiten Links zu Internetauftritten aufweisen, z. B. Online-Publikationen. Die fehlenden F Filtermöglichkeiten stellen ein weiteres Problem dar, denn aus archivischer Sicht sind nicht alle aufrufbaren Informationen archivwürdig 79 . Nachteilig ist ferner, dass die Dauer des „Erntens“ nicht abzuschätzen ist. Denn der Kopiervorgang wird erst abgebrochen, wenn alle Dateien aus dem 74 Vgl. Arms, Minerva, 2001. 75 Vgl. Hakala, NEDLIB, 2001. 76 Vgl. Tab. 1 – Projekte: „The Internet Archive“, „Kulturarw3“, „EWA“, „NWA“. 77 Zum Beispiel: .se für Schweden, .fr für Frankreich, .com 78 Vgl. Lyman, Archiving WWW, 2002. 79 Vgl. Kapitel „Bewertung“. 32
Ablauf der Archivierung definierten Bereich gefunden wurden. Schwierig gestaltet sich zudem die Darstellung des Ergebnisses. Alle gefundenen Informationen werden in einem Ranking angezeigt und würden nicht in ihrem ursprünglichen Zusammenhang des Intranets stehen. Das widerspricht dem Ansatz zur Archivierung von digitalen Aufzeichnungen, deren Inhalt, Kontextinformationen und strukturelle Zusammenhänge zu erhalten 80 . 3. Verwendung einer Spiegelungssoftware zur selektiven Archivierung des Intranets „… there is the selective approach where documents deemed worthy of preservation are selected by humans.“ 81 Bei einer auswählenden Herangehensweise werden archivwürdige Dokumente durch die intellektuelle Bewertung für die Archivierung mittels einer Spiegelungssoftware ausgewählt. Dieses Vorgehensweise eignet sich, um den Archivierungsbereich bereits ausgewählte Websites einzugrenzen 82 . Mit der Software werden alle Dateien einer URL bis in eine bestimmte Verzeichnungsstufe kopiert und heruntergeladen. Es können verschiedene Filtereinstellungen vorgenommen werden. Die Spiegelung dauert nur wenige Minuten. Nachteilig ist, dass es mit der Software schwer möglich sein wird, umfangreiche Websites vollständig zu archivieren. Eine Spiegelung ist nicht geeignet für Websites mit interaktiven und überwiegend dynamischen Webseiten. Während der Untersuchung und Testphase für die Archivierung des Intranets im Februar 2003 schien für das Intranet die auswählende Herangehensweise mit einer Spiegelungssoftware am geeignetsten. Aus 80 „The preservation of electronic records poses new and demanding challenges for archivists [...] for records to srve as evidence, the content, context and structure of the records - which in the electronic environment are independent of the medium – must be retained. („Records Preservation“ in:: ICA, Guide, 1997) 81 Arvison, Kulturarw3Project, 2000. 82 “A selective approach based on pre-selection, capture and cataloguing of individual Web sites.” (Masanès, Web Archiving, 2002) 33
- Seite 1 und 2: Fachhochschule Potsdam University o
- Seite 3 und 4: Inhaltsverzeichnis 1. Einleitung...
- Seite 5 und 6: Abkürzungsverzeichnis BRAIN Bankwi
- Seite 7 und 8: Einleitung 1. Einleitung Die Entwic
- Seite 9 und 10: Das Historische Archiv der Dresdner
- Seite 11 und 12: Die Durchführung 3.1 Vorbereitung
- Seite 13 und 14: Die Durchführung anschließend auf
- Seite 15 und 16: Die Durchführung Webarchivierungsp
- Seite 17 und 18: Archivierung von Webseiten durch
- Seite 19 und 20: Archivierung von Webseiten „[…]
- Seite 21 und 22: Das Intranet der Dresdner Bank AG 5
- Seite 23 und 24: Das Intranet der Dresdner Bank AG D
- Seite 25 und 26: Das Intranet der Dresdner Bank AG D
- Seite 27 und 28: Das Intranet der Dresdner Bank AG b
- Seite 29 und 30: Das Intranet der Dresdner Bank AG P
- Seite 31 und 32: Das Intranet der Dresdner Bank AG
- Seite 33 und 34: Das Intranet der Dresdner Bank AG 5
- Seite 35 und 36: Das Intranet der Dresdner Bank AG D
- Seite 37: Ablauf der Archivierung 1. Datenexp
- Seite 41 und 42: Ablauf der Archivierung XML-Dokumen
- Seite 43 und 44: Ablauf der Archivierung Speicherkap
- Seite 45 und 46: Die Bewertung 7. Die Bewertung Nach
- Seite 47 und 48: Die Bewertung deren Ausgaben vollst
- Seite 49 und 50: Die Bewertung goals of the digital
- Seite 51 und 52: Die Bewertung producing it and what
- Seite 53 und 54: Die Bewertung Im Unterschied zum ar
- Seite 55 und 56: Die Bewertung im Blick der Öffentl
- Seite 57 und 58: Die Bewertung dynamischen und inter
- Seite 59 und 60: Die Bewertung jedoch nicht aus, nur
- Seite 61 und 62: Die Bewertung 5. Aggregierungsgrad
- Seite 63 und 64: Die Bewertung Interesse für das Un
- Seite 65 und 66: Die Bewertung zum Zeitpunkt der Spi
- Seite 67 und 68: Die Bewertung Denn eine Navigation
- Seite 69 und 70: Die Bewertung Innerhalb der gespieg
- Seite 71 und 72: Die Bewertung kostenintensiv wird u
- Seite 73 und 74: Die Spiegelung video files. Ignorin
- Seite 75 und 76: Die Spiegelung 8.2 HTTrack HTTrack
- Seite 77 und 78: Die Spiegelung 8.2.2 Fazit Trotz ve
- Seite 79 und 80: Die Spiegelung Es wurde bereits erw
- Seite 81 und 82: Sicherung und Erhaltung des Intrane
- Seite 83 und 84: Sicherung und Erhaltung des Intrane
- Seite 85 und 86: Sicherung und Erhaltung des Intrane
- Seite 87 und 88: Sicherung und Erhaltung des Intrane
Ablauf <strong>der</strong> Archivierung<br />
definierten Bereich gefunden wurden. Schwierig gestaltet sich zudem die<br />
Darstellung des Ergebnisses. Alle gefundenen Informationen werden in<br />
einem Ranking angezeigt und würden nicht in ihrem ursprünglichen<br />
Zusammenhang des <strong>Intranet</strong>s stehen. Das wi<strong>der</strong>spricht dem Ansatz zur<br />
Archivierung von digitalen Aufzeichnungen, <strong>der</strong>en Inhalt,<br />
Kontextinformationen und strukturelle Zusammenhänge zu erhalten 80 .<br />
3. Verwendung einer Spiegelungssoftware zur selektiven<br />
Archivierung des <strong>Intranet</strong>s<br />
„… there is the selective approach where documents deemed<br />
worthy of preservation are selected by humans.“ 81<br />
Bei einer auswählenden Herangehensweise werden archivwürdige<br />
Dokumente durch die intellektuelle Bewertung <strong>für</strong> die Archivierung mittels<br />
einer Spiegelungssoftware ausgewählt. Dieses Vorgehensweise eignet sich,<br />
um den Archivierungsbereich bereits ausgewählte Websites einzugrenzen 82 .<br />
Mit <strong>der</strong> Software werden alle Dateien einer URL bis in eine bestimmte<br />
Verzeichnungsstufe kopiert und heruntergeladen. Es können verschiedene<br />
Filtereinstellungen vorgenommen werden. Die Spiegelung dauert nur<br />
wenige Minuten.<br />
Nachteilig ist, <strong>das</strong>s es mit <strong>der</strong> Software schwer möglich sein wird,<br />
umfangreiche Websites vollständig zu archivieren. Eine Spiegelung ist nicht<br />
geeignet <strong>für</strong> Websites mit interaktiven und überwiegend dynamischen<br />
Webseiten.<br />
Während <strong>der</strong> Untersuchung und Testphase <strong>für</strong> die Archivierung des<br />
<strong>Intranet</strong>s im Februar 2003 schien <strong>für</strong> <strong>das</strong> <strong>Intranet</strong> die auswählende<br />
Herangehensweise mit einer Spiegelungssoftware am geeignetsten. Aus<br />
80 „The preservation of electronic records poses new and demanding challenges for<br />
archivists [...] for records to srve as evidence, the content, context and structure of the<br />
records - which in the electronic environment are independent of the medium – must be<br />
retained. („Records Preservation“ in:: ICA, Guide, 1997)<br />
81 Arvison, Kulturarw3Project, 2000.<br />
82 “A selective approach based on pre-selection, capture and cataloguing of individual Web<br />
sites.” (Masanès, Web <strong>Archiving</strong>, 2002)<br />
33