Archiving websites Archivierungskonzept für das Intranet der Dresdner

Weitere Magazine

Empfehlungen

Info

Archivierung von Webseiten 4.1 Allgemeines 4. Archivierung von Webseiten Die Webtechnologie hat sich seit Anfang der 90er Jahre des vergangenen Jahrhunderts rapide entwickelt. Es werden immer mehr Informationen über das Web verteilt und sind einer immer breiter werdende Masse an Benutzern zugänglich. Die Informationen verschwinden sehr schnell. Im Internet ändern sich Webseiten durchschnittlich alle zwei bis fünf bzw. zwei bis sechs Monate 9 . Die Computertechnologie wechselt so schnell, dass nach Meinung der National Library of Australia die Schnittstellen zwischen den Systemen, die technischen Standards und die Dateistrukturen alle 20 Jahre völlig anders sind als heutzutage 10 . Das fordert Bibliothekare und Archivare heraus. Denn auch diese Informationen sollten nicht nur für die Gegenwart sondern auch für zukünftigen Generationen erhalten bleiben. Rhetorisch stellt Johan Mannerheim die Frage, ob nicht auch historisches Interesse an wertvollen Informationen bestehe, die im World Wide Web (bzw. hier im Intranet) zu finden sind. Deshalb ermutigt er Bibliothekare mit seinem Tagungsbeitrag „The WWW and our digital heritage – the new preservation tasks of the library community“ zur dauerhaften Aufbewahrung von Webseiten 11 . 4.2 Projekte Der Anstoß für die Archivierung von Webseiten kam aus dem Bibliotheksbereich, wie die Projekte 12 zeigen. Mitte der 90er Jahre des vorigen Jahrhunderts begannen einige Bibliotheken mit der Sicherung von Online-Publikationen. Auf dieser Grundlage entstanden Projekte für die Archivierung von einzelnen Websites. Zu nennen ist hier besonders das PANDORA-Projekt (Preserving and Accessing Networked Documentary Resources of Australia) der National Library of Australia. Die National Archives of Australia archivieren dabei Websites der Commonwealth- Regierung. Weitere Meilensteine sind die Archivierung von Internetseiten 9 Die Angaben zur durchschnittlichen Lebensdauer variieren ein wenig. Vgl. 2-6 Monate nach: Masanès, Web Archiving, 2002; 3-5 Monate nach: Mannerheim, heritage, 2000. 10 Vgl. NLA, PANDORA, 2001. 11 Mannerheim, heritage, 2000. 12 Vgl. Tab. 1: Archiving websites – Projekte. 10
Archivierung von Webseiten durch „The Internet Archive“, die Archivierung des schwedischen Internets im Kulturarw3-Projekt, sowie die Gründung der Vereinigung EWA (European Web Archive) und der Vereinigung europäischer nationaler Bibliotheken NEDLIB (Networked European Deposit LIBrary) zur Entwicklung einer Infrastruktur für digitale Publikationen. Aus diesen Projekten der Zusammenarbeit gehen weitere Projekte hervor. Archive sind auf dem Fachgebiet noch eindeutig unterrepräsentiert. Es ist aber auch festzustellen, dass die Archivierung der Websites immer mehr zum Thema wird 13 . 4.3 Herangehensweisen In den bereits laufenden Projekten zur Archivierung von Webseiten wird zwischen zwei Vorgehensweisen unterschieden. Die eine wird oft als „comprehensive approach“ 14 (vollständige Herangehensweise), die andere als „selective approach“ (auswählende Herangehensweise) bezeichnet 15 . Die vollständige Herangehensweise stellt die Sichtweise von Computerfachleuten dar, deren Schwerpunkt es ist, eine Technologie zu benutzen, um Informationen zu verlinken. Hierbei liegt der Fokus auf der Entwicklung von Suchmaschinen. Diese Strategie setzt bereits vorhandene Technik ein, die bei Suchmaschinen wie Google oder Altavista angewendet werden. Auf eine Anfrage des Benutzers wird mit einem „Web crawler“, auch „Web harvester“ (Engl: Ernter, von „Ernten“ abgeleitet) genannt, das gesamte Web nach einem vordefinierten „web space“ durchsucht, z. B. *.de, *.com, *.dresdner.net. Das Ergebnis wird in einem Ranking dargestellt. Diese URL-Seiten werden „geholt“ und auf eingebettete Links analysiert. Das „Ernten“ von Webseiten wird erst beendet, wenn alle URLs des vordefinierten Bereichs abgefragt wurden. 13 Vgl. Schmitz, Archivierung, 2002. Auch auf der Jahrestagung 2003 der Vereinigung deutscher Wirtschaftsarchivare e.V. berichtete Frau Dr. Helen Müller, dass das Historische Archiv der Bertelsmann AG sich mit dieser Problematik auseinandersetzen muss. 14 Im Englischen wird diese Herangehensweise bezeichnet als „comprehensive approach“ oder auch „bulk approach“. Julien Masanès beschreibt diese Strategie als eine „automatic harvesting policies“ (automatisch erntende Strategie). (Masanès, Web Archiving, 2001) 15 Vgl. Masanès, Web Archiving, 2001; Lyman, Archiving WWW, 2002; Mannerheim, heritage, 2000. 11
Seite 1 und 2: Fachhochschule Potsdam University o
Seite 3 und 4: Inhaltsverzeichnis 1. Einleitung...
Seite 5 und 6: Abkürzungsverzeichnis BRAIN Bankwi
Seite 7 und 8: Einleitung 1. Einleitung Die Entwic
Seite 9 und 10: Das Historische Archiv der Dresdner
Seite 11 und 12: Die Durchführung 3.1 Vorbereitung
Seite 13 und 14: Die Durchführung anschließend auf
Seite 15: Die Durchführung Webarchivierungsp
Seite 19 und 20: Archivierung von Webseiten „[…]
Seite 21 und 22: Das Intranet der Dresdner Bank AG 5
Seite 23 und 24: Das Intranet der Dresdner Bank AG D
Seite 27 und 28: Das Intranet der Dresdner Bank AG b
Seite 29 und 30: Das Intranet der Dresdner Bank AG P
Seite 31 und 32: Das Intranet der Dresdner Bank AG
Seite 33 und 34: Das Intranet der Dresdner Bank AG 5
Seite 37 und 38: Ablauf der Archivierung 1. Datenexp
Seite 39 und 40: Ablauf der Archivierung definierten
Seite 41 und 42: Ablauf der Archivierung XML-Dokumen
Seite 43 und 44: Ablauf der Archivierung Speicherkap
Seite 45 und 46: Die Bewertung 7. Die Bewertung Nach
Seite 47 und 48: Die Bewertung deren Ausgaben vollst
Seite 49 und 50: Die Bewertung goals of the digital
Seite 51 und 52: Die Bewertung producing it and what
Seite 53 und 54: Die Bewertung Im Unterschied zum ar
Seite 55 und 56: Die Bewertung im Blick der Öffentl
Seite 57 und 58: Die Bewertung dynamischen und inter
Seite 59 und 60: Die Bewertung jedoch nicht aus, nur
Seite 61 und 62: Die Bewertung 5. Aggregierungsgrad
Seite 63 und 64: Die Bewertung Interesse für das Un
Seite 65 und 66: Die Bewertung zum Zeitpunkt der Spi
Seite 67 und 68:
Die Bewertung Denn eine Navigation
Seite 69 und 70:
Die Bewertung Innerhalb der gespieg
Seite 71 und 72:
Die Bewertung kostenintensiv wird u
Seite 73 und 74:
Die Spiegelung video files. Ignorin
Seite 75 und 76:
Die Spiegelung 8.2 HTTrack HTTrack
Seite 77 und 78:
Die Spiegelung 8.2.2 Fazit Trotz ve
Seite 79 und 80:
Die Spiegelung Es wurde bereits erw
Seite 81 und 82:
Sicherung und Erhaltung des Intrane
Seite 83 und 84:
Seite 85 und 86:
Seite 87 und 88:
Seite 89 und 90:
Seite 91 und 92:
Seite 93 und 94:
Zusammenfassung 7. Brennen der Date
Seite 95 und 96:
Zusammenfassung 10.2. Fazit - Oblig
Seite 97 und 98:
Frame Ein abgetrennter Bereich auf
Seite 99 und 100:
Literatur- und Quellenverzeichnis (
Seite 101 und 102:
Lixfeld, Dirk [zit. Lixfeld, brain,
Seite 103 und 104:
Stadsarchief Antwerpen: Metadatasch
Seite 105 und 106:
99 Tab. 1: Archiving websites - Pro
Seite 107 und 108:
101 NWA (Nordic Web Archive) 11/200
Seite 109 und 110:
103 Private Kunden und Geschäftsku
Seite 111 und 112:
105 Abb. 2: Das Intranet der Dresdn
Seite 113 und 114:
107 Abb. 4: Das Intranet der Dresde
Seite 115 und 116:
Web-TV - Archiv „Archiv“ Diskus
Seite 117 und 118:
Abb. 9: Meta-Tags im Styleguide 2.1
Seite 119 und 120:
113 Abb. 11: Archivierungsablauf f
Seite 121 und 122:
Abb.13: Beispiele für die Online-B
Seite 123 und 124:
Abb. 15: Faktoren für die Risikoan
Seite 125 und 126:
Gesellschaftspolitisches Engagement
Seite 127 und 128:
Anzeigen (*pdf, *mpg-Dateien), Bild
Seite 129 und 130:
123 Abb. 19: Teleport Pro - Screens
Seite 131 und 132:
125 Abb. 21: Das Intranet der Dresd
Seite 133:
127 [Druckvorlage] Abb. 23: Der Abl
Alle anzeigen

Archiving websites Archivierungskonzept für das Intranet der Dresdner

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?