Archiving websites Archivierungskonzept für das Intranet der Dresdner

Archiving websites Archivierungskonzept für das Intranet der Dresdner Archiving websites Archivierungskonzept für das Intranet der Dresdner

forge.fh.potsdam.de
von forge.fh.potsdam.de Mehr von diesem Publisher
02.12.2012 Aufrufe

Die Durchführung 3.1.1 Das Projekt „Internet Archiv“ im Archiv der sozialen Demokratie Das Projekt „Internet Archiv“ besteht seit 1998 im Archiv der sozialen Demokratie, Abteilung Digitale Sammlung. Das Ziel des Projektes ist, die Internetauftritte der SPD zu archivieren und diese auf Dauer zu sichern. Dazu gehören die Auftritte der SPD auf Bundesebene, der Bundestagsfraktion und der 16 Landesverbände mit ihren Untergliederungen sowie die Webauftritte der Friedrich-Ebert-Stiftung, u.a. mit der Sonderseite zur Europawahl und des Archivs der sozialen Demokratie. Um die Charakteristik der Webtechnologie beizubehalten, so dass die Funktionalitäten der Navigation, Javascripten, Links und andere Besonderheiten erhalten bleiben, wird der gesamte Internetauftritt mit Teleport Pro gespiegelt 5 . Bei der Auswahl der Archivierungsmethode war für das Archiv wichtig, dass, im Gegensatz zu einem einfachen Download oder der Kopie von Dateien, die ursprünglichen Zusammenhänge erhalten bleiben. Die Kriterien für die Spiegelungsintervalle und –tiefe sind noch nicht festgelegt. Besonders die Spiegelungsintervalle sind Ziele, die noch im Rahmen eines Projektes angestrebt werden. Bisher wurden die Internetauftritte auf Bundesebene dreimal, auf Landesebene zweimal gespiegelt, die mit individuell festgelegten Terminen (z. B. bei Wahlkämpfen) ergänzt werden. Die Spiegelungstiefe richtet sich in erster Linie nach der zu spiegelnden Ausgangsseite. Allgemein wird davon ausgegangen, dass bei der Spiegelung der Startseite eine tiefergehende Linkebene gewählt wird. Innerhalb des selben Pfades wird für die Startseite von www.spd.de eine Linktiefe von sieben Ebenen angegeben. Die Spiegelung dauert je nach Einstellung nur wenige Minuten. Das heruntergeladene Ergebnis wird auf Links überprüft, die von der Software nicht weiter verfolgt wurden. Da Teleport Pro selbst keine Protokollmöglichkeit bietet, wird der Archivierungsprozess analog protokolliert. Im folgenden Schritt werden die Dateien für das Brennen aufbereitet. Von dem gespiegelten Internetauftritt wird ein Index erstellt, der mit den Daten 5 Zum Begriff „Spiegelung“ siehe S. 11f. und S. 67. 6

Die Durchführung anschließend auf CD-ROM geschrieben wird. Das Ergebnis auf CD-ROM wird abschließend mit der gespiegelten Datenmenge verglichen. Das ausgewählte Speichermediums bereitet einige Schwierigkeiten, da zusätzliche und zeitaufwendige Arbeitsschritte erforderlich sind 6 . Nach Ansicht von Herrn Schmitz stellt nicht die Speicherkapazität 7 des Speichermediums das Problem dar, sondern die begrenzte Länge der Verzeichnungskette. Die Begrenzung verhindert das Abspeichern von Dateien mit langen Pfadnamen. Deshalb wird eine Komprimierung der Datenmenge, die auf das Medium gebrannt werden soll, durchgeführt. Denn die Dateien werden anschließend als Ganzes betrachtet, so dass die Länge der Dateinamen kein Problem mehr darstellt. Für die Präsentation wird vor die archivierte Website eine Eingangsseite gestellt. Sie enthält: Name, Signatur, Datum sowie die Funktionen „Seite anzeigen“, „Recherche in der Seite“ und „Beenden“. Für die Darstellung der archivierten Seiten wird der entsprechende Browser und für die eingebundenen Formate die entsprechenden Programme benötigt (Acrobat Reader, Word o.a.). Wird die Rechercheoption ausgewählt, erscheint dem Benutzer ein gewohntes Bild, wie es bei Suchmaschinen üblich ist. Die Treffer werden in einem Ranking mit dem Link angezeigt. Eine Migrationstrategie besteht zur Zeit noch nicht. Ferner werden die archivierten Snapshots nicht mit einer Archivsoftware verwaltet. Sie werden einerseits über die Verzeichnungsstruktur auf der Festplatte verwaltet und andererseits auf CD-ROM gespeichert. Um eine genaue Vorstellung von dem Spiegelungsprozess zu bekommen, hat Herr Schmitz einen Test von dem Internetauftritt der Dresdner Bank AG www.dresdner-bank.com durchgeführt. Für die Spiegelung wurde eingestellt: eine Linktiefe von 3 Ebenen, alle Arten vorhandener Inhalte sowie ein externer Link. Die Spiegelung war nach ungefähr fünf Minuten 6 Nach Meinung von Herrn Schmitz würde er aus heutiger Sicht nicht mehr CD als Speichermedium empfehlen, sondern Magnetbänder (Streamer) verwenden. 7 Die Speicherkapazität einer CD-ROM beträgt ca. 650 MB (Stichwort „CD-ROM“ in: Barnert, Brockhaus, 2003). Eine Spiegelung vom 22.11.01 umfasste 486 MB. (SCHMITZ, S. 136) 7

Die Durchführung<br />

3.1.1 Das Projekt „Internet Archiv“ im Archiv <strong>der</strong> sozialen<br />

Demokratie<br />

Das Projekt „Internet Archiv“ besteht seit 1998 im Archiv <strong>der</strong> sozialen<br />

Demokratie, Abteilung Digitale Sammlung. Das Ziel des Projektes ist, die<br />

Internetauftritte <strong>der</strong> SPD zu archivieren und diese auf Dauer zu sichern.<br />

Dazu gehören die Auftritte <strong>der</strong> SPD auf Bundesebene, <strong>der</strong><br />

Bundestagsfraktion und <strong>der</strong> 16 Landesverbände mit ihren<br />

Unterglie<strong>der</strong>ungen sowie die Webauftritte <strong>der</strong> Friedrich-Ebert-Stiftung, u.a.<br />

mit <strong>der</strong> Son<strong>der</strong>seite zur Europawahl und des Archivs <strong>der</strong> sozialen<br />

Demokratie. Um die Charakteristik <strong>der</strong> Webtechnologie beizubehalten, so<br />

<strong>das</strong>s die Funktionalitäten <strong>der</strong> Navigation, Javascripten, Links und an<strong>der</strong>e<br />

Beson<strong>der</strong>heiten erhalten bleiben, wird <strong>der</strong> gesamte Internetauftritt mit<br />

Teleport Pro gespiegelt 5 . Bei <strong>der</strong> Auswahl <strong>der</strong> Archivierungsmethode war<br />

<strong>für</strong> <strong>das</strong> Archiv wichtig, <strong>das</strong>s, im Gegensatz zu einem einfachen Download<br />

o<strong>der</strong> <strong>der</strong> Kopie von Dateien, die ursprünglichen Zusammenhänge erhalten<br />

bleiben. Die Kriterien <strong>für</strong> die Spiegelungsintervalle und –tiefe sind noch<br />

nicht festgelegt. Beson<strong>der</strong>s die Spiegelungsintervalle sind Ziele, die noch im<br />

Rahmen eines Projektes angestrebt werden. Bisher wurden die<br />

Internetauftritte auf Bundesebene dreimal, auf Landesebene zweimal<br />

gespiegelt, die mit individuell festgelegten Terminen (z. B. bei<br />

Wahlkämpfen) ergänzt werden. Die Spiegelungstiefe richtet sich in erster<br />

Linie nach <strong>der</strong> zu spiegelnden Ausgangsseite. Allgemein wird davon<br />

ausgegangen, <strong>das</strong>s bei <strong>der</strong> Spiegelung <strong>der</strong> Startseite eine tiefergehende<br />

Linkebene gewählt wird. Innerhalb des selben Pfades wird <strong>für</strong> die Startseite<br />

von www.spd.de eine Linktiefe von sieben Ebenen angegeben. Die<br />

Spiegelung dauert je nach Einstellung nur wenige Minuten. Das<br />

heruntergeladene Ergebnis wird auf Links überprüft, die von <strong>der</strong> Software<br />

nicht weiter verfolgt wurden. Da Teleport Pro selbst keine<br />

Protokollmöglichkeit bietet, wird <strong>der</strong> Archivierungsprozess analog<br />

protokolliert.<br />

Im folgenden Schritt werden die Dateien <strong>für</strong> <strong>das</strong> Brennen aufbereitet. Von<br />

dem gespiegelten Internetauftritt wird ein Index erstellt, <strong>der</strong> mit den Daten<br />

5 Zum Begriff „Spiegelung“ siehe S. 11f. und S. 67.<br />

6

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!