28.02.2013 Aufrufe

Sharing Knowledge: Scientific Communication - SSOAR

Sharing Knowledge: Scientific Communication - SSOAR

Sharing Knowledge: Scientific Communication - SSOAR

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

200 Natascha Schumann, Wolfgang Meier, Sue Heise, Rudi Schmiede<br />

vester basiert auf XML und verwandten Standards, wie beispielsweise SAX 24<br />

(Simple API for XML)<br />

Ähnlich wie Apache’s Cocoon 25 , ein Framework für Web Publishing zur Verarbeitung<br />

von XML, basiert das Harvesting-Konzept von SozioNet auf der Nutzung<br />

von Pipelines. Während bei Cocoon ein XML-Stream eingegeben und ein<br />

beliebiges Datenformat ausgegeben wird, funktioniert das SozioNet-Konzept<br />

genau andersherum: Ein beliebiges Format kann eingesammelt werden, durchläuft<br />

verschiedene Stationen, z.B. Normalizer, Summarizer, Serializer und wird<br />

als wohl geformtes XML ausgegeben.<br />

Institute, die die Metadaten erstellt haben, geben die Adressen der zu durchsuchenden<br />

Seiten an, und die Harvesting-Komponente von SozioNet durchläuft<br />

diese dann in regelmäßigen Abständen.<br />

Alle eingesammelten Metadaten werden in einer zentralen Datenbank gespeichert.<br />

Der Harvester übernimmt die Volltextindexierung und muss auf Updates<br />

reagieren. URLs können auch direkt in die Datenbank eingegeben werden,<br />

so dass der Harvester nicht vollständig die Webadressen indexiert, sondern nur<br />

solche, bei denen bekanntermaßen für SozioNet relevante Ressourcen vorhanden<br />

sind.<br />

Da alle Komponenten in SozioNet in XML beschrieben sind, werden die Metadatensätze<br />

in einer XML-Datenbank vorgehalten.<br />

Die folgende Abbildung gibt einen schematischen Überblick über die Architektur<br />

von SozioNet:<br />

Harvesting-<br />

Komponente<br />

Volltexte +<br />

Metadaten<br />

Institutsserver<br />

Datenabgleich<br />

Zugriff auf<br />

Volltextsuche<br />

Liste vorhandener<br />

Ressourcen<br />

Update<br />

Optional:<br />

Download<br />

Metadaten<br />

Abb.1: Architektur von SozioNet<br />

24 http://www.saxproject.org/<br />

25 http://cocoon.apache.org/<br />

Metadaten<br />

speichern<br />

Technik:<br />

Überblick<br />

Webinterface<br />

(Teil des späteren Infoconnex Fachportals)<br />

<br />

...<br />

<br />

vorhandene<br />

Ressourcen<br />

auszeichnen<br />

Datenbank<br />

SozioNet-<br />

Seite<br />

erstellen<br />

Benutzer in<br />

Institut/Einrichtung<br />

Userprofile<br />

verwalten<br />

Recherche

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!