07.03.2014 Aufrufe

Social Semantic Desktop - Informationssysteme

Social Semantic Desktop - Informationssysteme

Social Semantic Desktop - Informationssysteme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Social</strong> <strong>Semantic</strong> <strong>Desktop</strong><br />

Seminararbeit<br />

vorgelegt von<br />

Stefan Tomanek<br />

Soziales Retrieval im Web 2.0<br />

Sommersemester 2008<br />

Arbeitsgruppe <strong>Informationssysteme</strong><br />

Datum: 12. Oktober 2008<br />

Betreuung:<br />

Dipl.-Inform. Ingo Frommholz


Inhaltsverzeichnis<br />

1 Einführung 2<br />

2 Informationsorganisation: Wunsch und Wirklichkeit 2<br />

2.1 Visualisierung kognitiver Zustände . . . . . . . . . . . . . . . 3<br />

2.1.1 Mindmapping . . . . . . . . . . . . . . . . . . . . . . . 3<br />

2.1.2 Concept-Mapping . . . . . . . . . . . . . . . . . . . . . 4<br />

2.2 Organisation physischer Informationsträger . . . . . . . . . . . 4<br />

2.3 Künstliche Gedächtniserweiterung . . . . . . . . . . . . . . . . 5<br />

2.4 Unzulänglichkeiten klassischer Dateisysteme . . . . . . . . . . 6<br />

2.4.1 Taxonomische Ordnung . . . . . . . . . . . . . . . . . . 6<br />

2.4.2 Inkongruenz von Dateien und Dokumenten . . . . . . . 8<br />

2.5 Semantisch orientierte Anwendungen . . . . . . . . . . . . . . 8<br />

3 Implementierung des <strong>Social</strong> <strong>Semantic</strong> <strong>Desktop</strong>s 10<br />

3.1 RDF als Integrationsformat . . . . . . . . . . . . . . . . . . . 10<br />

3.1.1 Bäume zu Graphen . . . . . . . . . . . . . . . . . . . . 12<br />

3.2 Herkunft der Metadaten . . . . . . . . . . . . . . . . . . . . . 13<br />

3.3 SPARQL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13<br />

3.4 Soziale RDF-Datenbanken . . . . . . . . . . . . . . . . . . . . 14<br />

3.5 Der zukünftige Weg . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

4 Fazit 18<br />

Abbildungsverzeichnis<br />

1 Mindmap zur Reflexion eines Themengebiets . . . . . . . . . . 3<br />

2 Concept-Map zur Darstellung verwandter Konzepte . . . . . . 4<br />

3 Hardlinks erlauben die Plazierung von Dateien in mehreren<br />

Verzeichnissen . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />

4 Inkongruenz von Dokumenten und Dateien . . . . . . . . . . . 8<br />

5 Semantisch orientierte Photo-Verwaltung mit F-Spot . . . . . 9<br />

6 RDF-Aussagen in N3 . . . . . . . . . . . . . . . . . . . . . . . 11<br />

7 Transformation einer Dateihierarchie zu einem RDF-Graphen 12<br />

8 Graph-Anfragen mit SPARQL . . . . . . . . . . . . . . . . . . 14<br />

9 Informationssuche mit Edutella . . . . . . . . . . . . . . . . . 15<br />

10 Verteilte Metadaten-Datenbank mit RDFPeers . . . . . . . . . 16<br />

1


1 Einführung<br />

Informationen nehmen mit jedem Tag technischer Entwicklung weniger physischen<br />

Raum ein: was früher voluminöse Aktenschränke, CD-Regale und<br />

Fotoalben erforderte, findet mittlerweile auf handtellergroßen Speichermedien<br />

Platz. Die digitale Durchdringung des Alltags führt sowohl im privaten<br />

als auch geschäftlichen Umfeld zu einer steigenden Anzahl an elektronisch<br />

vorliegenden Dokumenten: Während deren Speicherung zwar mit modernen<br />

Mitteln erfolgt, bleibt ihre Organisation jedoch weiterhin an alten Ordnungsparadigmen<br />

der physischen Welt haften — die Dateisysteme der geläufigen<br />

Betriebssysteme bieten meist nicht mehr Funktionalität als ein virtueller Aktenschrank,<br />

lassen also in ihrem Aufbau den tatsächlichen Informationsinhalt<br />

der einzelnen Dokumente unberücksichtigt.<br />

Das Aufkommen des sogenannten Web 2.0 vermochte es, diese klassische<br />

Betrachtungsweise aufzubrechen und verschiedene Dokumente in semantisch<br />

orientierter Weise zu präsentieren: Informationen verschiedener Autoren und<br />

Typen können in Relation zueinander gesetzt, kommentiert und ausgetauscht<br />

werden. Der <strong>Social</strong> <strong>Semantic</strong> <strong>Desktop</strong>[1, 2] hat das Ziel, viele der im Web 2.0<br />

erprobten Techniken aus dem Web-Browser in das lokale System zu transferieren<br />

und die dabei enstehenden zusätzlichen Möglichkeiten für den Anwender<br />

nutzbar zu machen.<br />

Diese Arbeit soll zunächst die Probleme und Unzulänglichkeiten aufzeigen,<br />

die klassische <strong>Desktop</strong>- und Dateisysteme bei der strukturierten Datenablage<br />

haben. Die dabei geschilderten Diskrepanzen zwischen den kognitiven<br />

Prozessen des Anwenders und der Umsetzung der Anwendungsprogramme<br />

sollen anschließend behandelt und zumindest teilweise aufgelöst werden. Dabei<br />

sollen Technologien vorgestellt werden, die eine semantische Organisation<br />

lokal vorliegender Daten und deren Anwendungs-, Anwender- und Rechnerübergreifende<br />

Verknüpfung erlauben. Neben den Chancen und Möglichkeiten<br />

müssen selbstverständlich auch die Risiken beachtet werden, die eine<br />

solche Vermaschung privater und potentiell sensitiver Informationen mit sich<br />

bringt.<br />

2 Informationsorganisation: Wunsch und Wirklichkeit<br />

Eine Informationsablage sollte die Denkprozesse und -strukturen ihres Benutzers<br />

nachahmen: Im Gegensatz zu streng hierarchischen Ordnungssystemen<br />

assoziiert der menschliche Geist Informationen sehr frei untereinander; eine<br />

Wissenseinheit steht nie für sich alleine, sondern ist stets mit anderen<br />

2


Konzepten verknüpft. Die Gestalt dieses Wissensnetzes wird dabei durch<br />

die individuellen Erfahrungen des Anwenders geprägt: vergangene Erlebnisse<br />

können erstaunliche Themensprünge hervorbringen, die für Außenstehende<br />

und objektive Betrachter kurios erscheinen, für das betroffene Individuum<br />

jedoch durchaus passend und logisch sind.<br />

2.1 Visualisierung kognitiver Zustände<br />

2.1.1 Mindmapping<br />

Zur Unterstützung kognitiver Prozesse haben sich verschiedene Visualisierungsmethoden<br />

entwickelt: Eine sehr bekannte Variante ist das sogenannte<br />

,,Mindmapping”[3], bei dem zur besseren Überblickung eines Themas eine sogenannte<br />

Gedächtniskarte erstellt wird. Im Zentrum dieser Darstellung steht<br />

das Hauptthema, von dem Äste mit weiteren Unterkapiteln nach außen ragen.<br />

Auf diese Weise lagern sich konzentrisch um das Themengebiet verwandte<br />

und assoziierte Begriffe und Konzepte an, die wiederum selbst als Keim<br />

für weitergehende Assoziationen dienen.<br />

Abbildung 1: Mindmap zur Reflexion eines Themengebiets<br />

In der Ausgestaltung der Gedächtniskarte ist der Anwender recht frei: Ne-<br />

3


en Schlagworten kann sie auch Bilder enthalten, um die visuell orientierten<br />

Regionen des Gehirns anzusprechen. In jedem Fall bleibt sie jedoch zentral<br />

auf ihr Wurzelelement ausgerichtet.<br />

2.1.2 Concept-Mapping<br />

Im Kontrast zum Mindmapping mit seinen radialen, baumartigen Strukturen<br />

steht Concept Mapping: Die von John D. Novak[4] in den 1970er Jahren an<br />

der Cornell University entwickelte Notation erfordert nicht zwingend einen<br />

einzelnen zentralen Begriff, sondern verknüpft Konzepte durch gerichtete und<br />

beschriftete Kanten. Die Kantenbeschriftung konkretisiert dabei die Art der<br />

Relation, in der die verbundenen Begriffe stehen. Während Mindmaps stets<br />

zentral auf einen einzelnen Begriff ausgerichtet sind, erlauben Concept-Maps<br />

die Integration mehrerer Agglomerationskerne, die als Ausgangspunkte des<br />

Diagramms fungieren. Dieses bewegt sich meist innerhalb eines Konzept-<br />

Rahmens, dass die Thematik des Gesamtzusammenhangs vorgibt.<br />

mag<br />

Mensch<br />

akzeptiert<br />

hält<br />

mag<br />

Haustier<br />

ist ein<br />

ist ein<br />

Katze<br />

jagt<br />

Hund<br />

spielt mit<br />

kann<br />

Wollknäuel<br />

bellen<br />

Abbildung 2: Concept-Map zur Darstellung verwandter Konzepte<br />

2.2 Organisation physischer Informationsträger<br />

Die strukturierte Ablage physischer Informationsträger unterliegt den Limitierungen<br />

der physischen Welt: Bücher innerhalb einer Bibliothek benötigen<br />

Raum und sind in ihrer Anzahl begrenzt. Um ihre Auffindbarkeit sicherzustellen,<br />

müssen sie anhand eines eindeutigen Ordnungskriteriums kategorisiert<br />

werden. Die dabei entstehende Taxonomie erlaubt aufgrund ihrer klaren<br />

4


Baumstruktur nicht die Zuteilung eines Buches in zwei Kategorien: jedes Dokument<br />

ist genau einem übergeordneten Thema zugewiesen und befindet sich<br />

infolgedessen an einem definierten Ort.<br />

Die Distanz zweier Dokumente innerhalb der Taxonomie muss nicht mit<br />

der assoziativen Distanz im kognitiven Netz des Anwenders korrelieren: Die<br />

Verfolgung kleiner Querverweise eines Dokumentes können, sofern sie disziplinäre<br />

Grenzen überspringen, zu großen Sprüngen innerhalb der Bibliothekshierarchie<br />

führen. Für einen Anwender, der gerade ein Buch über Quantenphysik<br />

liest und seine Kenntnisse über Statistik vertiefen möchte, mag dieser<br />

assoziative Schritt sehr klein sein; je nach Struktur der Bibliothek wird er<br />

das Statistik-Werk vermutlich jedoch nicht im Regal der Physik-Bücher finden,<br />

sondern in der Mathematik-Abteilung – also unter Umständen in großer<br />

physischer Distanz.<br />

Die Grenzen der physischen Welt machen es schwer, Denkstrukturen<br />

nachzubilden, zumal diese stets individuell sind und von der Perspektive<br />

abhängen. Institutionen, die von einer vielzahl verschiedener Personen genutzt<br />

werden, müssen daher eine starke Hierarchie verwenden, um die Anordnung<br />

der vorgehaltenen Informationen zumindest für alle nachvollziehbar<br />

zu halten.<br />

2.3 Künstliche Gedächtniserweiterung<br />

Die Technik, Informationen losgelöst von körperlichen Exemplaren zu verarbeiten,<br />

ermöglicht die Grenzen real-räumlicher Anordnung zu durchbrechen.<br />

Bereits 1945 veröffentlichte Vannevar Bush seinen Artikel ,,As we may<br />

think”[5]: Der amerikanische Ingenieur, bisher vor allem in der Analogrechner-<br />

Entwicklung und im Manhatten-Projekt involviert, schlug darin die Konstruktion<br />

einer Maschine vor, die ihrem Benutzer als Erweiterung seines<br />

Gedächtnisses dienen sollte. Das Memex – als Kurzform für ,,Memory Extender”<br />

– genannte System sollte Informationen in Form von Mikrofilmen<br />

aufnehmen und dem Benutzer auf mehreren Bildschirmen zur Verfügung stellen.<br />

Durch Eingabe einer Ziffernkombination konnte dieser auf einzelne Dokumente<br />

zugreifen und mit Hilfe eines Rades durch die verschiedenen Seiten<br />

blättern.<br />

Doch Memex sollte mehr leisten als vordefinierte Folien zu projizieren:<br />

Der Benutzer sollte Dokumente miteinander verknüpfen können, um so Querverweise<br />

direkt verfolgen zu können. Betrachtete er also ein Dokument, so<br />

zeigte die schreibtischgroße Maschine auf einem zweiten Bildschirm verwandte<br />

Dokumente an. Dokumente ließen sich so zu ,,Trains” anordnen, die nicht<br />

zwingend der ursprünglichen Reihenfolge entsprechen, in der die Dokumente<br />

in das System eingegeben wurden. Neben Mikrofilmmedien sollte das System<br />

5


auch in der Lage sein, handschriftliche Notizen über berührungsempfindliche<br />

Oberflächen aufzuzeichen und als zusätzliche Dokumente in den Datenbestand<br />

einzufügen. Durch diese Möglichkeiten wäre es Memex möglich gewesen,<br />

sich individuell auf die kognitiven Strukturen des Anwenders einzustellen<br />

und Dokumente-Auswahlen individuell zusammenzustellen. Im Gegensatz zu<br />

modernen Hypertext-Systemen – wie etwa dem WWW – ließen sich bei Memex<br />

nicht einzelne Elemente einer Bildschirmseite mit anderen Dokumenten<br />

verknüpfen; atomare Einheit sollte das gesamte Dokument sein.<br />

Memex wurde in der vorgeschlagenen Form nie realisiert: Tatsächlich<br />

stellt Bushs Artikel lediglich eine visionäre Extrapolation der zur Zeit der<br />

Veröffentlichung aktuellen Technik dar. Viele der dabei aufgeworfenen Ideen<br />

fanden jedoch in modernisierter Form Eingang in Hypertext- und Dokument-<br />

Verwaltungssysteme.<br />

2.4 Unzulänglichkeiten klassischer Dateisysteme<br />

Real existierende Computer nutzen zur Datenablage ein baumartiges Dateisystem.<br />

Betriebssysteme der Windows-Familie stellen dabei jeden einzelnen<br />

phyischen Datenträger als isolierten Baum dar, während Unix-Abkömmlinge<br />

alle Medien zu einer gemeinsamen Hierarchie vereinigen. Beiden Familien<br />

gemein ist jedoch die Unterscheidung zwischen Verzeichnissen und regulären<br />

Dateien: Während erstgenannte lediglich der Strukturierung des abgelegten<br />

Datenbestandes dienen, enthalten Dateien die eigentlichen Informationen.<br />

2.4.1 Taxonomische Ordnung<br />

Klassische Dateisysteme bieten zwei Mittel, um Dokumente zu organisieren:<br />

Dateien werden mit Namen versehen und anschließend in Verzeichnissen kategorisiert.<br />

Dabei gehört eine Datei oder auch ein Verzeichnis stets zu einem<br />

übergeordneten Verzeichnis, so dass sich eine strikte Baumstruktur ergibt.<br />

Diese strikte Hierarchisierung ist oft hinderlich, da es nicht möglich ist,<br />

eine Datei mehreren Kategorien zuzuordnen. So ist es in den meisten Systemen<br />

zum Beispiel nicht möglich, ein Rechnungsdokument sowohl in einem<br />

Verzeichnis mit Kundenkorrespondenz als auch in einem für Rechnungen vorgesehenen<br />

zu plazieren.<br />

Das Dateisystem, im Sinne der auf dem Datenträger geschriebenen Verwaltungsstruktur,<br />

unterstützt eine solche m-zu-n-Zuordnung in vielen Fällen<br />

durchaus: Die meisten <strong>Desktop</strong>-Systeme pflegen jedoch die Ordner-Metapher,<br />

die ein solches Verhalten nicht erlaubt. Die Unterscheidung der Begriffe ,,Ordner”<br />

und ,,Verzeichnis” scheint haarspalterisch, fördert jedoch einen gewaltigen<br />

Bedeutungsunterschied zu Tage: Während ein Aktenordner die darin<br />

6


einsortierten Dokumente wirklich enthält, beinhaltet ein Verzeichnis lediglich<br />

Verweise auf den eigentlichen Ablageort. Ein Buch über die Tierwelt Afrikas<br />

kann sowohl in einem Buchverzeichnis über Biologie als auch in einer anderen<br />

Liste über den schwarzen Kontinent verzeichnet sein; genauso ist es bei vielen<br />

Dateisystemen möglich, Dateien – nicht jedoch Verzeichnisse – in mehreren<br />

Verzeichnissen zu plazieren.<br />

/<br />

home<br />

max<br />

Rechnungen<br />

Korrespondenz<br />

Musterfirma<br />

Musterfirma<br />

Rechnung 1442 Brief 20083107<br />

Abbildung 3: Hardlinks erlauben die Plazierung von Dateien in mehreren<br />

Verzeichnissen<br />

Jeder Eintrag in einem Verzeichnis wird dabei als Link oder auch Hardlink<br />

bezeichnet; alle Verzeichniseinträge einer Datei sind gleichberechtigt und<br />

voneinander unabhängig: Erst, wenn der letzte Verweis entfernt wird, gilt die<br />

Datei als gelöscht.<br />

Mit Hardlinks ist es also durchaus möglich, eine Art Tagging für Dateien<br />

zu implementieren: Jedes Verzeichnis, dem ein Verweis auf die Datei hinzugefügt<br />

wird, kann als zusätzliches Etikett verstanden werden, das Art und<br />

Inhalt der Datei weiter beschreibt.<br />

Die Verwendung von Hardlinks zur Datenorganisation ist jedoch eingeschränkt:<br />

Die zusätzlichen Verweise lassen sich nicht über Datenträgergrenzen<br />

hinweg erstellen und bieten keine Möglichkeit, direkte Beziehungen zwischen<br />

Dateien auszudrücken. Es ist auch nicht möglich, auf effiziente Art und<br />

Weise alle Hardlinks zu finden, die auf ein bestimmtes Dokument verweisen.<br />

Zudem besteht aufgrund der schlechten Unterstützung in grafischen Benutze-<br />

7


oberflächen das Risiko von Fehlbedienungen und versehentlichen Löschungen,<br />

falls versehentlich der letzte existente Verzeichniseintrag eines Dokuments<br />

entfernt wird.<br />

2.4.2 Inkongruenz von Dateien und Dokumenten<br />

Ein weiteres Argument gegen die Verwendung von Dateisystem-Eigenschaften<br />

zur semantischen Organisation von Datenbeständen liegt in der Tatsache begründet,<br />

dass Dateien und Dokumente nicht zwangsläufig deckungsgleich sein<br />

müssen: Oft enthalten Objekte, die auf Dateisystemebene atomar erscheinen,<br />

aus Anwendungssiche mehrere Dokumente. Klassische Beispiele für diese verborgenen,<br />

inneren Strukturen sind Mailboxdateien oder auch Adressbücher,<br />

die mehrere Informationseinheiten zu einer Datei bündeln. Für Hardlinks sind<br />

diese feingranularen Einheiten nicht greifbar, da Wissen über die Syntax der<br />

Container-Datei erforderlich ist.<br />

/<br />

home<br />

Eingang<br />

max<br />

mbox<br />

Gesendet<br />

Rechnungen<br />

Projekte<br />

Foo<br />

Abbildung 4: Inkongruenz von Dokumenten und Dateien<br />

2.5 Semantisch orientierte Anwendungen<br />

Da semantisches Wissen über einzelne Dokumente auf Betriebs- und Dateisystemebene<br />

nicht verfügbar ist, muss es über spezielle Anwendungen gewonnen<br />

werden. Besonders im Bereich der Mediendaten haben sich Anwendungen<br />

herausgebildet, die sich von der unterliegenden Dateisystemstruktur lösen<br />

und eigene Mechanismen zur Datenorganisation implementieren.<br />

Bekannt ist dieses Vorgehen besonders bei Audio-Abspielprogrammen wie<br />

iTunes, Rhythmbox oder Amarok: Musikstücke werden nicht über das Dateisystem<br />

verwaltet, sondern zu einer koherenten Sammlung hinzugefügt. Die<br />

8


Anwendungen ignorieren bewusst die Verzeichnisstrukturen, aus denen die<br />

Dateien stammen und wandeln den Baum in eine flache Menge um. Indem sie<br />

Metadaten aus den einzelnen Dateien extrahieren und in einer separaten Datenbank<br />

speichern, ermöglichen sie beliebige Anfragen über gemeinsame Eigenschaften<br />

der gewünschten Audio-Dokumente: Aus der Datenbank können<br />

beliebige Teilmengen extrahiert werden, die auf den semantisch orientierten<br />

Attributen der Daten fußen und nicht auf Pfadangaben, deren Aussagekraft<br />

sehr eingeschränkt ist.<br />

Die Verflachung synthetischer Hierarchien zugunsten der Bildung von semantisch<br />

attributierten Objektmengen lässt sich auch auf andere Medientypen<br />

übertragen: Digitale Photos werden bereits bei ihrer Erstellung durch<br />

die Kamera mit zahlreichen Metadaten ausgestattet, die neben technischen<br />

Aspekten – wie Belichtungszeit und Blendenöffnung – die zeitliche und, dank<br />

integrierter GPS-Empfänger in neuen Geräten, räumliche Einordnung erlauben.<br />

Gerade bei photographischen Dokumenten fällt die Einordnung in strikte<br />

Hierarchien oft schwer, da sich selten ein herausragendes Ordnungskriterium<br />

festmachen lässt: Neben Ort und Zeit sind die abgebildeten Objekte oder<br />

Personen oft Ziel einer Suche.<br />

Abbildung 5: Semantisch orientierte Photo-Verwaltung mit F-Spot<br />

Die freie Software F-Spot 1 stellt importierte Photos mit Hilfe eines Zeitstrahls<br />

dar. Zusätzliche semantische Informationen können Bildern in Form<br />

von Tags, also einzelnen Schlagworten, hinzugefügt werden. Tags selbst können<br />

in einer Hierarchie angeordnet werden, so dass zum Beispiel Personen- und<br />

Ortsbezeichnungen in jeweils eigenen Kategorien erscheinen: Dadurch ist es<br />

zum Beispiel möglich, Photos zu selektieren, die eine beliebige Person darstellen<br />

– und mit einem Tags versehen sind, der dieser Kategorie zugeordnet<br />

ist.<br />

1 http://f-spot.org/Main_Page<br />

9


Anwendungsgestützte semantische Ordnung bietet einen Vorgeschmack<br />

auf Dinge, die durch die Loslösung vom starren hierarchischen Ordnungsmodell<br />

möglich sind. Allerdings handelt es sich bei den bekannten Applikationen<br />

nur um Insellösungen: Jede pflegt ihr eigenen Datenbankformat und ist in<br />

sich abgeschottet. Es ist nicht möglich, Musik- und Photo-Dokumente miteinander<br />

zu verknüpfen oder gar aus dritten Anwendungen die Metadaten zu<br />

nutzen.<br />

3 Implementierung des <strong>Social</strong> <strong>Semantic</strong> <strong>Desktop</strong>s<br />

Derartige Insellösungen aufzubrechen und eine semantisch orientierte Zugriffsmethode<br />

über Anwendungsgrenzen hinweg aufzustellen ist eines der<br />

Hauptziele bei der Implementierung des <strong>Semantic</strong> <strong>Desktop</strong>s. An die Position<br />

der strikten hierarchischen Dateisystemstrukturen als primäres Ordnungsinstrument<br />

tritt ein Graph, dessen Knoten aus allen Dokumenten des Anwenders<br />

besteht, dessen Kanten beliebige Beziehungen und Metadaten repräsentieren,<br />

und der von allen semantik-affinen Anwendungen genutzt und gepflegt<br />

wird.<br />

3.1 RDF als Integrationsformat<br />

Als gemeinsames Datenformat hat sich RDF 2 , das vom W3C entworfene<br />

,,Resource Description Framework”, etabliert. Ursprünglich als Metadatenformat<br />

für Webseiten entwickelt, findet es mit einer vielzahl syntaktischer<br />

Ausprägungen Verwendung für zahlreiche Modellierungsaufgaben.<br />

Neben einer XML-basierten Notation hat sich vor allem die N3-Schreibweise<br />

durchgesetzt. RDF-Aussagen sind Dreier-Tupel, die aus Subjekt, Prädikat<br />

und Objekt bestehen. Das Subjekt stellt dabei das Element dar, über das<br />

eine Aussage getroffen wird, deren Art und Ausprägung durch Prädikat und<br />

das dazugehörige Objekt bestimmt werden. Jedes Element des Tripels wird<br />

in Form eines URI 3 dargestellt – mit Ausnahme des Objektes, das auch eine<br />

Zeichenkette sein kann.<br />

Die Verwendung eines URI als primäres Identifikationsmerkmal bietet<br />

Vorteile gegenüber der Verwendung der geläufigeren URL: Jeder gültige URL<br />

stellt gleichzeitig einen validen URI dar, macht gleichzeitig jedoch auch eine<br />

Aussage über die Bezugsmethode, mit Hilfe derer die Ressource erlangt<br />

werden kann. Dies ist jedoch nicht in jedem Fall gewünscht, da zirkulierende<br />

2 http://www.w3.org/RDF/<br />

3 Uniform Resource Identifier<br />

10


Import des Dublin-Core-Namensraumes<br />

@prefix dc: .<br />

// Import benutzerdefinierter Praedikate<br />

@prefix db: .<br />

db:isReplyTo <<br />

file:///home/stefan/Auftrag.pdf>.<br />

db:pictures <<br />

abook:Stefan%20Tomanek>.<br />

dc:title "<br />

Seminarfolien <strong>Social</strong> Retrieval".<br />

Abbildung 6: RDF-Aussagen in N3<br />

Dokumente unter Umständen nicht an einen dedizierten Speicherort gebunden<br />

sind. Es besteht auch kein Zwang, jede Ressource zwingend mit einem<br />

Dokument zu hinterlegen: URIs können auch abstrakte Konzepte darstellen,<br />

was besonders bei der Verwendung als Prädikat zum tragen kommt.<br />

Das in N3-Syntax vorliegende Beispiel (siehe Abbildung 6) trifft verschiedene<br />

Aussagen über dem System bekannte Dokumente und verwendet dabei<br />

Prädikate aus verschiedenen Quellen: Zum einen die bekannten Dublin-Core-<br />

Elemente 4 , in denen ein Standardrepertoire an häufig benötigten Metadaten-<br />

Typen zur Verwendung im Internet zusammengefasst wurde, zum anderen<br />

eine benutzerdefinierte Sammlung spezieller Prädikate. Das System lässt sich<br />

dadurch beliebig für den gewünschten Anwendungsbereich ausbauen – sollen<br />

Metadaten jedoch ausgetauscht werden, sollte man sich auf ein gängiges Vokabular<br />

einigen. Das Prädikat ,,isReplyTo” setzt zwei Dokumente in Relation<br />

zueinander: Die kausale Folge der geschriebenen Rechnung auf den erhaltenen<br />

Auftrag lässt sich so leicht modellieren und abbilden. Ebenso beschreibt das<br />

Verb ,,pictures” das auf einem Photo abgebildete Objekt, indem es einen Eintrag<br />

im lokalen Adressbuch referenziert. Dem bekannten Tagging ähnelt die<br />

Verwendung von Zeichenketten: Im vorliegenden Beispiel nutzt N3 das standardisierte<br />

Dublin-Core-Vokabular, um den Titel eines über eine Prüfsumme<br />

identifizierten Dokuments in der lokalen RDF-Datenbasis abzulegen.<br />

4 http://dublincore.org/<br />

11


3.1.1 Bäume zu Graphen<br />

Durch das Einfügen von RDF-Kanten wandelt sich das hierarchisch strukturierte<br />

Dateisystem in einen gerichteten Graphen, der sich wie eine transparente<br />

Folie über die bestehenden Hierarchien legt (siehe Abbildung 7). Durch<br />

verschiedenartige Prädikate (in der Abbildung durch unterschiedliche Farben<br />

gekennzeichnet) können unterschiedliche Relationen zwischen Dokumenten<br />

gekennzeichnet werden, ebenso stellt das bekannte Tagging eine Untermenge<br />

dar: Tags erwachsen ganz intuitiv aus dem Graphenkonzept, indem das<br />

Objekt durch eine Zeichenkette repräsentiert wird.<br />

Abbildung 7: Transformation einer Dateihierarchie zu einem RDF-Graphen<br />

Im Gegensatz zur dateisystembasierten Ordnung können Dokumente nicht<br />

nur in gemeinsame Kategorien eingeteilt, sondern direkt mit typisierten Relationen<br />

untereinander versehen werden. Ein abgeschickter Brief kann daher<br />

in seinen Metadaten vermerken, dass er eine Reaktion auf eine erhaltene E-<br />

Mail darstellt - die wiederum über eine Kante im RDF-Graphen mit ihrem<br />

Absender im lokalen Adressbuch verknüpft ist. Auf diese Weise lassen sich<br />

Zusammenhänge zwischen Dokumenten, Akteuren und Konzepten schnell<br />

und in maschinell verarbeitbarer Weise sichern.<br />

Ganz ähnlich der Vision ,,Memex” ist eine semantik-affine Oberfläche<br />

durch geschickte Nutzung der Metadaten in der Lage, zur Benutzersituation<br />

passende Dokumente zu präsentieren und so das Informationsbedürfnis des<br />

Anwenders auf kognitiv hoher Ebene zu füllen.<br />

12


3.2 Herkunft der Metadaten<br />

Doch woher stammen die Metadaten, die für eine solche Adaption notwendig<br />

sind? Im einfachsten Falle bringen Dokumente bereits leicht erfassbare und<br />

klar strukturierte Daten mit. Dies ist vor allem bei Mediendokumenten wie<br />

Ton- und Bildaufnahmen der Fall. Bei Eintritt in das System müssten die<br />

inherenten Meta-Informationen aus den Dateien extrahiert und in den systemweiten<br />

RDF-Graphen eingefügt werden. Bestimmte Informationen lassen<br />

sich nur schwer automatisiert erkennen; die Erkennung von Bildinhalten<br />

und die dazugehörige Annotation wird weiterhin dem menschlichen Benutzer<br />

überlassen bleiben.<br />

Viele Metainformationen lassen sich jedoch aus den Handlungen des Benutzers<br />

selbst ableiten: Öffnet er zum Beispiel zwei verschiedene Dokumente<br />

gleichzeitig, so lässt sich aus dieser Handlung eine inhaltliche Relation der<br />

beiden herleiten. Ein weiteres Beispiel ist die Sammlung von Bewegungsprofilen<br />

über einen tragbaren GPS-Empfänger während des Microsoft-Projektes<br />

,,MyLifeBits” 5 : Korrelationen zwischen den Aufenthaltsorten und den danach<br />

resultierenden Informationsbedürfnissen und Handlungen sind ebenfalls<br />

zur Gruppierung verwandter Dokumente von Nutzen.<br />

Eine primäre Quelle zusätzlicher Informationen wird sicherlich die Verwendung<br />

semantik-affiner Programme darstellen, die entsprechende Meta-<br />

Informationen direkt bei der Erstellung oder Bearbeitung von Dokumenten<br />

gewinnen und in den lokalen Graphen einfügen.<br />

3.3 SPARQL<br />

Um Abfragen auf einem RDF-Graphen durchzuführen, entwickelte das RDF-<br />

Data-Access-Arbeitsgruppe des W3C die Anfragesprache SPARQL (,,Simple<br />

Protocol and RDF Query Language”) 6 , die Anfang des Jahres 2008 den<br />

Status einer offiziellen W3C-Empfehlung[6] erreichte. Die Sprache benutzt<br />

zur Selektion Anfrage-Tripel, die gegen die Tupel des RDF-Graphen geprüft<br />

werden. Mit Hilfe gleichbenannter Variablen innerhalb der Anfrage können<br />

– analog zum Tupelkalkül – verschiedene Kanten des Graphen miteinander<br />

verbunden werden, so dass auch komplexe Anfragen durch verknüpfung verschiedener<br />

Informations- und Datenquellen möglich sind.<br />

So durchsucht die Anfrage in Abbildung 8 den lokalen RDF-Graphen<br />

nach allen bekannten Photos, die eine weibliche Person zeigen, deren Telefonnummer<br />

im Adressbuch Verzeichnet ist; dieses Beispiel zeigt, wie bisher<br />

5 http://research.microsoft.com/barc/mediapresence/MyLifeBits.aspx<br />

6 http://www.w3.org/TR/rdf-sparql-query/<br />

13


PREFIX db: <br />

PREFIX ab: <br />

SELECT ?photo ?phone<br />

WHERE {<br />

?photo db:pictures ?person.<br />

?person ab:hasGender ab:female;<br />

ab:hasPhoneNumber ?phone.<br />

}<br />

Abbildung 8: Graph-Anfragen mit SPARQL<br />

vollkommen disjunkte Datenspeicher durch SPARQL und die gemeinsame<br />

RDF-Datenbasis miteinander vernetzt werden.<br />

3.4 Soziale RDF-Datenbanken<br />

Die wenigsten Dokumente bleiben jedoch exklusiv einem einzelnen Benutzer<br />

vorbehalten: Arbeit findet meist in Gruppen statt, ebenso werden Fotos und<br />

andere Mediendateien oft im kleinen oder auch größeren Kreis ausgetauscht.<br />

Verlässt ein Dokument – zumindest als Kopie – das lokale System, zum Beispiel,<br />

indem es per E-Mail verschickt wird, wird es auch aus dem mühevoll<br />

erstellten RDF-Graphen gerissen. Die Kanten, die auf dem Ursprungssystem<br />

noch wertvolle Kontextinformationen geliefert haben, verschwinden auf<br />

dem dem Empfänger: Selbst wenn dieser eine ähnliche semantisch orientierte<br />

Oberfläche nutzt, erscheint das neue Dokument zunächst ,,nackt”.<br />

Gerade in Arbeitsgruppen, die oft Informationen austauschen, muss daher<br />

ein Weg gefunden werden, die semantischen Verknüpfungen auch über<br />

den Transportweg hinaus zu erhalten; genauso sollen Anwender von neuen<br />

Relationen profitieren, die andere aufgrund der ihnen vorliegenden Daten erzeugen.<br />

Diese soziale Komponente erfordert losgelöst von der Übermittlung<br />

der eigentlichen Dokumente einen Austausch auf Metadatenebene.<br />

Ein naheliegender Ansatz besteht darin, den lokalen RDF-Graphen einer<br />

zentralen instanz gegenüber offenzulegen und von dieser indizieren zu lassen;<br />

anfragende Systeme können Metainformationen über ihnen vorliegende Dokumente<br />

anhand des eindeutigen URIs von dieser zentralen Stelle erfragen.<br />

Die Verwendung einer zentralen Sammelstelle, die alle lokalen Graphen in<br />

sich vereinigt, bringt jedoch Probleme mit sich: Mit wachsender Benutzerzahl<br />

wird es stetig schwieriger, den zentralen Index aktuell zu halten, ebenso<br />

widerspricht das Gebot der Datensparsamkeit einer solchen Datenzusammen-<br />

14


allung.<br />

Eine Alternative zu einer zentralistischen RDF-Suchmaschine stellen Peerto-Peer-Systeme<br />

dar. Das Projekt Edutella 7 nutzt dazu ein unstrukturiertes<br />

Netz, wie es vom Filesharing-System Gnutella bekannt ist. Neue Knoten, die<br />

dem Netz beitreten möchten, stellen eine Verbindung zu mindestens einem<br />

System her, das bereits Teil des Netzes ist; sie selbst werden dabei wieder<br />

Anlaufpunkt für andere Klienten, die das gleiche Anliegen haben. Auf diese<br />

Weise entsteht eine vermaschte Struktur, in der jedes System auf Anfragen<br />

nach seiner Datenbasis antworten kann.<br />

Jeder Knoten leitet eingehende Anfragen an alle Knoten weiter, zu denen<br />

er eine Verbindung hält: So breiten sie sich wellenförmig durch das Netz<br />

aus. Eventuelle Antworten werden auf direktem Wege dem ursprünglichen<br />

Fragesteller übermittelt. Um die Enstehung endloser Zyklen zu vermeiden,<br />

ist jede Anfrage mit einer maximalen Lebenszeit (TTL) versehen, die bei<br />

jeder Weiterleitungsstation dekrementiert wird.<br />

?<br />

Abbildung 9: Informationssuche mit Edutella<br />

Die unstrukturierte Natur der Anfrageübermittlung und -verarbeitung<br />

bringt Probleme bei der Informationssuche mit sich: So ist für den Anfragesteller<br />

nicht ersichtlich, ob es zu einer Anfrage keine Ergebnistupel im Netz<br />

gibt, oder ob die Anfrage aufgrund zu geringer TTL die betroffenen Knoten<br />

7 http://www.edutella.org/<br />

15


nie erreicht hat; ebenso kann er nicht entscheiden, ob seine Anfrage noch<br />

im Netz zirkuliert, oder ob er das Warten auf zusätzliche Ergebnistupel abbrechen<br />

kann. Abbildung 9 illustriert dieses Problem: Bei der vorliegenden<br />

Netzstruktur erreichen erst Anfragen mit einer TTL von mindestens 4 das<br />

System mit der gesuchten Information – begrenzt das Startsystem seine Traversierungstiefe<br />

auf 3, durchlaufen zwar 8 Nachrichten das Netz, ohne jedoch<br />

den Zielknoten erreichen zu können.<br />

Eine Alternative zur unstrukturierten Netzbildung Edutellas und dem<br />

zentralistischen Ansatz stellt die Bildung eines verteilten Indizes dar: Der von<br />

Min Cai und Martin Frank am Information Sciences Institute vorgeschlagene<br />

Ansatz 8 kommt ohne eine zentrale Instanz aus, erlaubt aber dennoch das<br />

sichere und schnelle Auffinden relevanter Tupel.<br />

Jeder teilnehmende Knoten im Netz wird dazu mit einer eindeutigen<br />

Identifikationsnummer versehen; alle teilnehmenden Knoten werden in einem<br />

Kreis angeordnet, und jeder teilnehmer erhält Kenntnis über die IDs<br />

der Systeme, die sich direkt vor ihm befinden, sowie über weitere Systeme<br />

mit exponentiell steigenden Kennziffern. Die Tripel, die in das System<br />

eingebracht werden, durchlaufen mit jeder ihrer Komponenten eine Hash-<br />

Funktion, die den Wert von Subjekt, Prädikat und Objekt jeweils auf den<br />

Zahlenraum der Knoten-IDs abbildet. So werden für jedes Tripel drei Systemkennungen<br />

ermittelt, deren nächstmöglicher Nachfolger im Netzring für<br />

das Tripel verantwortlich sind.<br />

S : P : O<br />

Abbildung 10: Verteilte Metadaten-Datenbank mit RDFPeers<br />

8 ,,RDFPeers: A Scalable Distributed RDF Repository based on A Structured Peer-to-<br />

Peer Network”, 2004<br />

16


Abbildung 10 zeigt, wie für Subjekt, Pärdikat und Objekt eines Tripels<br />

jeweils ein verantwortlicher Knoten ermittelt und das Tupel an diesen übergeben<br />

wird. Jedes Tripel ist demnach auf drei Systemen des Netzes gespeichert:<br />

Ein anfragender Rechner kann aus den gegebenen Parametern ebenfalls über<br />

die Hash-Funktion die Knoten-ID berechnen, die für die gesuchten Tupel<br />

zuständig ist. Aufgrund der exponentiellen Datenstruktur kann eine solche<br />

Anfrage den Ring mit geringem Aufwand traversieren und das zuständige System<br />

schnell erreichen, ohne wie beim Edutella-Ansatz alle Knoten durchlaufen<br />

zu müssen. Ist zumindest eine einzige Komponente des gesuchten Tripels<br />

vorgegeben, lassen sich die Ergebnisse bei einer Knotenzahl von n mit einem<br />

Aufwand von O(log(n)) ermitteln. Lediglich eine Anfrage ohne Parameter,<br />

also das vollständige Aufzählen aller Tripel, erfordert die Kontaktierung jedes<br />

einzelnen Netzknotens und birgt daher die lineare Komplexität O(n).<br />

Im Gegensatz zu Edutella lässt sich jedoch aufgrund der Ringstruktur des<br />

Netzes entscheiden, wann sämtliche Systeme kontaktiert wurden.<br />

3.5 Der zukünftige Weg<br />

Wie bei vielen Objekten der aktuellen Forschung und Entwicklung existieren<br />

auch im Bereich des <strong>Social</strong> <strong>Semantic</strong> <strong>Desktop</strong>s verschiedene Interpretationen<br />

und Strömungen: So haben einige Projekte nicht nur das Ziel, Anwendungen<br />

und Oberflächen auf eine gemeinsame Metadatenbasis zu stellen, sondern<br />

die verschiedenen Applikationen direkt zu einer koherenten Oberfläche<br />

zu verschmelzen, um technisch-syntaktische Unterschiede zwischen verschiedenen<br />

Dateiformaten zugunsten einer inhaltlich-semantischen Betrachtungsweise<br />

zu verdrängen. So tragen OpenOffice-Writer-Dokumente, PDF-Dateien<br />

und HTML-Seiten die gleichen Informationstypus, werden jedoch von jeweils<br />

verschiedenen und unterschiedlichen Programmen verarbeitet. Die amalgamisierung<br />

verschiedener Anwendungen ist jedoch ein radikaler Schnitt, der<br />

aufgrund des stark divergenten Funktionsumfangs vieler Applikationen nur<br />

schwer ohne Verluste essentieller Funktionen möglich ist.<br />

Ein weiterer Aspekt des <strong>Social</strong> <strong>Semantic</strong> <strong>Desktop</strong> besteht in der Erleichterung<br />

der kolaborativen Nutzung von Dokumenten: Es soll sehr einfach<br />

möglich sein, ein Dokument für die Nutzung durch andere freizugeben. Auf<br />

derzeitigen Systemen ist dies oft eine Frage des Speicherortes: Damit Interessierte<br />

die Datei beziehen können, muss sie sich in einem freigegebenen Verzeichnis<br />

oder auf einem Webserver befinden. Im Kontext des <strong>Social</strong> <strong>Semantic</strong><br />

<strong>Desktop</strong>s soll die Kolaboration eine Eigenschaft des Dokumentes werden und<br />

nicht seines Speicherortes: Die technischen Aspekte sollen dem Benutzer dazu<br />

weitgehend verborgen bleiben.<br />

Der Einfluss semantischer Gesichtspunkte sollte auch Einzug in Microsofts<br />

17


Betriebssystem Windows Vista halten: Unter dem Namen WinFS kündigte<br />

Microsoft eine Datenbankschicht an, die zusätzliche Attribute über Dateien<br />

vorhalten sollte. Doch mit dem Erscheinen Vistas wurde WinFS zunächst verschoben,<br />

anschließend komplett abgesagt; es soll in Zukunft unter Umständen<br />

als Teil des Microsoft SQL-Servers veröffentlicht werden.<br />

Ein wichtiger Anlaufpunkt ist das Projekt NEPOMUK (,,Networked Environment<br />

for Personalized, Ontology-based Management of Unified Knowledge”)<br />

9 , das Forscher, Software-Entwickler und die Industrie zusammenbringen<br />

und eine gemeinsame Basis zur Entwicklung des <strong>Social</strong> <strong>Semantic</strong><br />

<strong>Desktop</strong>s entwickeln möchte. Die Kombination offener und bereits heute<br />

verfügbarer Technologien – Peer-to-Peer-Systeme, Soziale Netze, Semantisch<br />

orientierte Oberflächen – soll zu einer übergreifenden Lösung führen. Eine erste<br />

Implementierung der von NEPOMUK vorgeschlagenen Richtlinien[7] findet<br />

in der freien <strong>Desktop</strong>-Oberläche KDE (,,KDE <strong>Desktop</strong> Environment”) 10<br />

statt: Die kürzlich veröffentlichte Version 4 unterstützt bereits das Taggen<br />

von Dateien. Eine weitere Referenzimplementierung stellt das Projekt ,,gnowsis”<br />

11 des Deutschen Forschungszentrums für künstliche Intelligenz (DFKI)<br />

dar.<br />

4 Fazit<br />

Die schrittweise Evolution der Benutzeroberfläche zu einer semantisch orientierten<br />

Sicht bietet viele neue Möglichkeiten, Informationen und Daten zu<br />

organisieren und zu vernetzen. Die klassischen Ordnungsparadigmen sind der<br />

Vielfältigkeit moderner Datensammlungen mit ihrer Vielzahl unterschiedlicher<br />

Datentypen nur schlecht gewachsen. Die multiplen Ordnungsmerkmale,<br />

die viele Dokumente bieten, lassen sich nur schwer in den archaisch wirkenden<br />

Baumstrukturen der gängigen Dateisysteme abbilden. Ebenso erlaubt die<br />

direkte Verknüpfung voneinander abhängiger Dateien den Nachvollzug ihrer<br />

Entstehung und der damit verbundenen Beweggründe. Durch ein- und ausgehende<br />

Kanten im RDF-Graphen lässt sich ein ,,Umriss” eines Dokumentes<br />

zeichnen, der dem semantisch stark eingeschränkten Dateinamen und -pfad<br />

weit überlegen ist: Die Verflachung und Auflösung der strikten Hierarchien<br />

ist gleichzeitig mit der Verdichtung des beschreibenden Netzes verbunden,<br />

dass Dateien und Dokumente miteinander verknüpft.<br />

Der Nutzen der Metadaten darf jedoch auch nicht überschätzt werden;<br />

während viele Dokumentenformate ihre Metadaten sehr einfach preisgeben<br />

9 http://nepomuk.semanticdesktop.org/<br />

10 http://www.kde.org/<br />

11 http://www.gnowsis.org/<br />

18


und automatisch verarbeiten lassen, sind andere Datenformate ohne menschliche<br />

Unterstützung nur schwer aufzuschlüsseln: Ein E-Mail-Programm kann<br />

den lokalen RDF-Graphen sehr einfach mit Kanten zwischen E-Mails, dem<br />

Adressbuch und verschickten Dateien anreichen – Bilder und Photos mit<br />

beschreibenden Tags auszustatten, wird jedoch weiterhin dem Benutzer obliegen.<br />

Dabei kommt die soziale Komponente zum tragen, die bereits aus<br />

Online-Diensten wie Flickr 12 oder Youtube 13 bekannt ist, in denen Tags auch<br />

von anderen Personen beigesteuert werden. Der Erfolg einer solchen Auslagerung<br />

hängt jedoch vom Interesse ab, die jene Personen den Dokumenten<br />

entgegenbringen – ebenso muss die Aufwandsschwelle möglichst gering sein,<br />

um möglichst wenige Benutzer von ihrem Beitrag abzuhalten. Je geringer<br />

jedoch allgemeine Attraktivität und subjektiv betrachteter Mehrwert sind,<br />

desto geringer fällt die Ausbeute an semantisch wertvollen Attributionen aus;<br />

gerade bei Dokumenten, die nur einer kleinen Personengruppe zugänglich gemacht<br />

werden sollen, entfällt logischerweise der Erkenntniszugewinn durch<br />

die vielen Namenlosen.<br />

Radikale Herangehensweisen, die die komplette Verschmelzung aller Anwendungen<br />

zu einer koherenten Oberfläche fordern, bringen natürlich einen<br />

Bruch mit bekannten Bedienungsparadigmen mit sich: Es muss sich zeigen,<br />

ob die dadurch zu erringenden Vorteile diesen großen Schritt rechtfertigen. In<br />

näherer Zukunft erscheint die evolutionäre Integration semantischer Komponenten<br />

in bestehende und erprobte Anwendungen der erfolgsversprechendere<br />

Weg.<br />

Die immense Ansammlung von Daten, die sich im Laufe der Zeit im RDF-<br />

Graphen ansammelt, kann ein Risiko darstellen: Besonders die hintergründig<br />

und ohne Benutzeraufforderung erfassten Metadaten erlauben weitreichende<br />

Einblicke in Arbeitsfeld und -weise des Anwenders und machen ihn seinem<br />

Computer gegenüber in gewisser Weise ,,gläsern”: Der Schutz dieser Informationen,<br />

deren Art und Umfang der Anwender oft selbst nicht überblicken<br />

kann, muss gewährleistet sein. Ein Diebstahl dieser Informationen würde<br />

zu erheblichen Datenschutzproblemen führen, ein Problem, das sich auch<br />

bei der gemeinsamen Nutzung von Metadaten stellt: Hier müssen effektive<br />

Schutzmechanismen geschaffen werden, um den Anwender nicht digital zu<br />

entblößen.<br />

Trotz der damit verbundenen Risiken und Probleme stellt der <strong>Social</strong> <strong>Semantic</strong><br />

<strong>Desktop</strong> eine hochinteressante Vision dar, deren Verfolgung in jedem<br />

Fall ein lohnendes Ziel für die Entwicklung zukünftiger <strong>Desktop</strong>- und <strong>Informationssysteme</strong><br />

darstellt. Seine Einführung wird nicht in Form einer Revo-<br />

12 http://www.flickr.com/<br />

13 http://youtube.com/<br />

19


lution erfolgen, sondern einzelne Komponenten des Gesamtkonzeptes werden<br />

nach und nach die bekannten Paradigmen ergänzen.<br />

Literatur<br />

[1] Stefan Decker and Martin Frank. The social semantic desktop. Technical<br />

report, Digital Enterprise Research Institute, 2004.<br />

[2] Leo Sauermann, Ansgar Bernardi, and Andreas Dengel. Overview and<br />

outlook on the semantic desktop, 2005.<br />

[3] Tony Buzan. The mind map book. Penguin Books, 1996.<br />

[4] John D. Novak. Learning Science in the Schools: Research Reforming<br />

Practice, chapter ,,Concept Mapping: A Strategy for Organizing Knowledge”,<br />

pages 229–245. Lawrence Erlbaum Associates, 1995.<br />

[5] Vannevar Bush. As we may think. The Atlantic Monthly, 176, 1945.<br />

[6] W3C. Sparql protocol for rdf: W3c recommendation 15th January 2008.<br />

http://www.w3.org/TR/2008/REC-rdf-sparql-protocol-20080115/.<br />

[7] The NEPOMUK Project - On the way to the <strong>Social</strong> <strong>Semantic</strong> <strong>Desktop</strong>,<br />

2007.<br />

20

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!