Social Semantic Desktop - Informationssysteme
Social Semantic Desktop - Informationssysteme
Social Semantic Desktop - Informationssysteme
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Social</strong> <strong>Semantic</strong> <strong>Desktop</strong><br />
Seminararbeit<br />
vorgelegt von<br />
Stefan Tomanek<br />
Soziales Retrieval im Web 2.0<br />
Sommersemester 2008<br />
Arbeitsgruppe <strong>Informationssysteme</strong><br />
Datum: 12. Oktober 2008<br />
Betreuung:<br />
Dipl.-Inform. Ingo Frommholz
Inhaltsverzeichnis<br />
1 Einführung 2<br />
2 Informationsorganisation: Wunsch und Wirklichkeit 2<br />
2.1 Visualisierung kognitiver Zustände . . . . . . . . . . . . . . . 3<br />
2.1.1 Mindmapping . . . . . . . . . . . . . . . . . . . . . . . 3<br />
2.1.2 Concept-Mapping . . . . . . . . . . . . . . . . . . . . . 4<br />
2.2 Organisation physischer Informationsträger . . . . . . . . . . . 4<br />
2.3 Künstliche Gedächtniserweiterung . . . . . . . . . . . . . . . . 5<br />
2.4 Unzulänglichkeiten klassischer Dateisysteme . . . . . . . . . . 6<br />
2.4.1 Taxonomische Ordnung . . . . . . . . . . . . . . . . . . 6<br />
2.4.2 Inkongruenz von Dateien und Dokumenten . . . . . . . 8<br />
2.5 Semantisch orientierte Anwendungen . . . . . . . . . . . . . . 8<br />
3 Implementierung des <strong>Social</strong> <strong>Semantic</strong> <strong>Desktop</strong>s 10<br />
3.1 RDF als Integrationsformat . . . . . . . . . . . . . . . . . . . 10<br />
3.1.1 Bäume zu Graphen . . . . . . . . . . . . . . . . . . . . 12<br />
3.2 Herkunft der Metadaten . . . . . . . . . . . . . . . . . . . . . 13<br />
3.3 SPARQL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13<br />
3.4 Soziale RDF-Datenbanken . . . . . . . . . . . . . . . . . . . . 14<br />
3.5 Der zukünftige Weg . . . . . . . . . . . . . . . . . . . . . . . . 17<br />
4 Fazit 18<br />
Abbildungsverzeichnis<br />
1 Mindmap zur Reflexion eines Themengebiets . . . . . . . . . . 3<br />
2 Concept-Map zur Darstellung verwandter Konzepte . . . . . . 4<br />
3 Hardlinks erlauben die Plazierung von Dateien in mehreren<br />
Verzeichnissen . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />
4 Inkongruenz von Dokumenten und Dateien . . . . . . . . . . . 8<br />
5 Semantisch orientierte Photo-Verwaltung mit F-Spot . . . . . 9<br />
6 RDF-Aussagen in N3 . . . . . . . . . . . . . . . . . . . . . . . 11<br />
7 Transformation einer Dateihierarchie zu einem RDF-Graphen 12<br />
8 Graph-Anfragen mit SPARQL . . . . . . . . . . . . . . . . . . 14<br />
9 Informationssuche mit Edutella . . . . . . . . . . . . . . . . . 15<br />
10 Verteilte Metadaten-Datenbank mit RDFPeers . . . . . . . . . 16<br />
1
1 Einführung<br />
Informationen nehmen mit jedem Tag technischer Entwicklung weniger physischen<br />
Raum ein: was früher voluminöse Aktenschränke, CD-Regale und<br />
Fotoalben erforderte, findet mittlerweile auf handtellergroßen Speichermedien<br />
Platz. Die digitale Durchdringung des Alltags führt sowohl im privaten<br />
als auch geschäftlichen Umfeld zu einer steigenden Anzahl an elektronisch<br />
vorliegenden Dokumenten: Während deren Speicherung zwar mit modernen<br />
Mitteln erfolgt, bleibt ihre Organisation jedoch weiterhin an alten Ordnungsparadigmen<br />
der physischen Welt haften — die Dateisysteme der geläufigen<br />
Betriebssysteme bieten meist nicht mehr Funktionalität als ein virtueller Aktenschrank,<br />
lassen also in ihrem Aufbau den tatsächlichen Informationsinhalt<br />
der einzelnen Dokumente unberücksichtigt.<br />
Das Aufkommen des sogenannten Web 2.0 vermochte es, diese klassische<br />
Betrachtungsweise aufzubrechen und verschiedene Dokumente in semantisch<br />
orientierter Weise zu präsentieren: Informationen verschiedener Autoren und<br />
Typen können in Relation zueinander gesetzt, kommentiert und ausgetauscht<br />
werden. Der <strong>Social</strong> <strong>Semantic</strong> <strong>Desktop</strong>[1, 2] hat das Ziel, viele der im Web 2.0<br />
erprobten Techniken aus dem Web-Browser in das lokale System zu transferieren<br />
und die dabei enstehenden zusätzlichen Möglichkeiten für den Anwender<br />
nutzbar zu machen.<br />
Diese Arbeit soll zunächst die Probleme und Unzulänglichkeiten aufzeigen,<br />
die klassische <strong>Desktop</strong>- und Dateisysteme bei der strukturierten Datenablage<br />
haben. Die dabei geschilderten Diskrepanzen zwischen den kognitiven<br />
Prozessen des Anwenders und der Umsetzung der Anwendungsprogramme<br />
sollen anschließend behandelt und zumindest teilweise aufgelöst werden. Dabei<br />
sollen Technologien vorgestellt werden, die eine semantische Organisation<br />
lokal vorliegender Daten und deren Anwendungs-, Anwender- und Rechnerübergreifende<br />
Verknüpfung erlauben. Neben den Chancen und Möglichkeiten<br />
müssen selbstverständlich auch die Risiken beachtet werden, die eine<br />
solche Vermaschung privater und potentiell sensitiver Informationen mit sich<br />
bringt.<br />
2 Informationsorganisation: Wunsch und Wirklichkeit<br />
Eine Informationsablage sollte die Denkprozesse und -strukturen ihres Benutzers<br />
nachahmen: Im Gegensatz zu streng hierarchischen Ordnungssystemen<br />
assoziiert der menschliche Geist Informationen sehr frei untereinander; eine<br />
Wissenseinheit steht nie für sich alleine, sondern ist stets mit anderen<br />
2
Konzepten verknüpft. Die Gestalt dieses Wissensnetzes wird dabei durch<br />
die individuellen Erfahrungen des Anwenders geprägt: vergangene Erlebnisse<br />
können erstaunliche Themensprünge hervorbringen, die für Außenstehende<br />
und objektive Betrachter kurios erscheinen, für das betroffene Individuum<br />
jedoch durchaus passend und logisch sind.<br />
2.1 Visualisierung kognitiver Zustände<br />
2.1.1 Mindmapping<br />
Zur Unterstützung kognitiver Prozesse haben sich verschiedene Visualisierungsmethoden<br />
entwickelt: Eine sehr bekannte Variante ist das sogenannte<br />
,,Mindmapping”[3], bei dem zur besseren Überblickung eines Themas eine sogenannte<br />
Gedächtniskarte erstellt wird. Im Zentrum dieser Darstellung steht<br />
das Hauptthema, von dem Äste mit weiteren Unterkapiteln nach außen ragen.<br />
Auf diese Weise lagern sich konzentrisch um das Themengebiet verwandte<br />
und assoziierte Begriffe und Konzepte an, die wiederum selbst als Keim<br />
für weitergehende Assoziationen dienen.<br />
Abbildung 1: Mindmap zur Reflexion eines Themengebiets<br />
In der Ausgestaltung der Gedächtniskarte ist der Anwender recht frei: Ne-<br />
3
en Schlagworten kann sie auch Bilder enthalten, um die visuell orientierten<br />
Regionen des Gehirns anzusprechen. In jedem Fall bleibt sie jedoch zentral<br />
auf ihr Wurzelelement ausgerichtet.<br />
2.1.2 Concept-Mapping<br />
Im Kontrast zum Mindmapping mit seinen radialen, baumartigen Strukturen<br />
steht Concept Mapping: Die von John D. Novak[4] in den 1970er Jahren an<br />
der Cornell University entwickelte Notation erfordert nicht zwingend einen<br />
einzelnen zentralen Begriff, sondern verknüpft Konzepte durch gerichtete und<br />
beschriftete Kanten. Die Kantenbeschriftung konkretisiert dabei die Art der<br />
Relation, in der die verbundenen Begriffe stehen. Während Mindmaps stets<br />
zentral auf einen einzelnen Begriff ausgerichtet sind, erlauben Concept-Maps<br />
die Integration mehrerer Agglomerationskerne, die als Ausgangspunkte des<br />
Diagramms fungieren. Dieses bewegt sich meist innerhalb eines Konzept-<br />
Rahmens, dass die Thematik des Gesamtzusammenhangs vorgibt.<br />
mag<br />
Mensch<br />
akzeptiert<br />
hält<br />
mag<br />
Haustier<br />
ist ein<br />
ist ein<br />
Katze<br />
jagt<br />
Hund<br />
spielt mit<br />
kann<br />
Wollknäuel<br />
bellen<br />
Abbildung 2: Concept-Map zur Darstellung verwandter Konzepte<br />
2.2 Organisation physischer Informationsträger<br />
Die strukturierte Ablage physischer Informationsträger unterliegt den Limitierungen<br />
der physischen Welt: Bücher innerhalb einer Bibliothek benötigen<br />
Raum und sind in ihrer Anzahl begrenzt. Um ihre Auffindbarkeit sicherzustellen,<br />
müssen sie anhand eines eindeutigen Ordnungskriteriums kategorisiert<br />
werden. Die dabei entstehende Taxonomie erlaubt aufgrund ihrer klaren<br />
4
Baumstruktur nicht die Zuteilung eines Buches in zwei Kategorien: jedes Dokument<br />
ist genau einem übergeordneten Thema zugewiesen und befindet sich<br />
infolgedessen an einem definierten Ort.<br />
Die Distanz zweier Dokumente innerhalb der Taxonomie muss nicht mit<br />
der assoziativen Distanz im kognitiven Netz des Anwenders korrelieren: Die<br />
Verfolgung kleiner Querverweise eines Dokumentes können, sofern sie disziplinäre<br />
Grenzen überspringen, zu großen Sprüngen innerhalb der Bibliothekshierarchie<br />
führen. Für einen Anwender, der gerade ein Buch über Quantenphysik<br />
liest und seine Kenntnisse über Statistik vertiefen möchte, mag dieser<br />
assoziative Schritt sehr klein sein; je nach Struktur der Bibliothek wird er<br />
das Statistik-Werk vermutlich jedoch nicht im Regal der Physik-Bücher finden,<br />
sondern in der Mathematik-Abteilung – also unter Umständen in großer<br />
physischer Distanz.<br />
Die Grenzen der physischen Welt machen es schwer, Denkstrukturen<br />
nachzubilden, zumal diese stets individuell sind und von der Perspektive<br />
abhängen. Institutionen, die von einer vielzahl verschiedener Personen genutzt<br />
werden, müssen daher eine starke Hierarchie verwenden, um die Anordnung<br />
der vorgehaltenen Informationen zumindest für alle nachvollziehbar<br />
zu halten.<br />
2.3 Künstliche Gedächtniserweiterung<br />
Die Technik, Informationen losgelöst von körperlichen Exemplaren zu verarbeiten,<br />
ermöglicht die Grenzen real-räumlicher Anordnung zu durchbrechen.<br />
Bereits 1945 veröffentlichte Vannevar Bush seinen Artikel ,,As we may<br />
think”[5]: Der amerikanische Ingenieur, bisher vor allem in der Analogrechner-<br />
Entwicklung und im Manhatten-Projekt involviert, schlug darin die Konstruktion<br />
einer Maschine vor, die ihrem Benutzer als Erweiterung seines<br />
Gedächtnisses dienen sollte. Das Memex – als Kurzform für ,,Memory Extender”<br />
– genannte System sollte Informationen in Form von Mikrofilmen<br />
aufnehmen und dem Benutzer auf mehreren Bildschirmen zur Verfügung stellen.<br />
Durch Eingabe einer Ziffernkombination konnte dieser auf einzelne Dokumente<br />
zugreifen und mit Hilfe eines Rades durch die verschiedenen Seiten<br />
blättern.<br />
Doch Memex sollte mehr leisten als vordefinierte Folien zu projizieren:<br />
Der Benutzer sollte Dokumente miteinander verknüpfen können, um so Querverweise<br />
direkt verfolgen zu können. Betrachtete er also ein Dokument, so<br />
zeigte die schreibtischgroße Maschine auf einem zweiten Bildschirm verwandte<br />
Dokumente an. Dokumente ließen sich so zu ,,Trains” anordnen, die nicht<br />
zwingend der ursprünglichen Reihenfolge entsprechen, in der die Dokumente<br />
in das System eingegeben wurden. Neben Mikrofilmmedien sollte das System<br />
5
auch in der Lage sein, handschriftliche Notizen über berührungsempfindliche<br />
Oberflächen aufzuzeichen und als zusätzliche Dokumente in den Datenbestand<br />
einzufügen. Durch diese Möglichkeiten wäre es Memex möglich gewesen,<br />
sich individuell auf die kognitiven Strukturen des Anwenders einzustellen<br />
und Dokumente-Auswahlen individuell zusammenzustellen. Im Gegensatz zu<br />
modernen Hypertext-Systemen – wie etwa dem WWW – ließen sich bei Memex<br />
nicht einzelne Elemente einer Bildschirmseite mit anderen Dokumenten<br />
verknüpfen; atomare Einheit sollte das gesamte Dokument sein.<br />
Memex wurde in der vorgeschlagenen Form nie realisiert: Tatsächlich<br />
stellt Bushs Artikel lediglich eine visionäre Extrapolation der zur Zeit der<br />
Veröffentlichung aktuellen Technik dar. Viele der dabei aufgeworfenen Ideen<br />
fanden jedoch in modernisierter Form Eingang in Hypertext- und Dokument-<br />
Verwaltungssysteme.<br />
2.4 Unzulänglichkeiten klassischer Dateisysteme<br />
Real existierende Computer nutzen zur Datenablage ein baumartiges Dateisystem.<br />
Betriebssysteme der Windows-Familie stellen dabei jeden einzelnen<br />
phyischen Datenträger als isolierten Baum dar, während Unix-Abkömmlinge<br />
alle Medien zu einer gemeinsamen Hierarchie vereinigen. Beiden Familien<br />
gemein ist jedoch die Unterscheidung zwischen Verzeichnissen und regulären<br />
Dateien: Während erstgenannte lediglich der Strukturierung des abgelegten<br />
Datenbestandes dienen, enthalten Dateien die eigentlichen Informationen.<br />
2.4.1 Taxonomische Ordnung<br />
Klassische Dateisysteme bieten zwei Mittel, um Dokumente zu organisieren:<br />
Dateien werden mit Namen versehen und anschließend in Verzeichnissen kategorisiert.<br />
Dabei gehört eine Datei oder auch ein Verzeichnis stets zu einem<br />
übergeordneten Verzeichnis, so dass sich eine strikte Baumstruktur ergibt.<br />
Diese strikte Hierarchisierung ist oft hinderlich, da es nicht möglich ist,<br />
eine Datei mehreren Kategorien zuzuordnen. So ist es in den meisten Systemen<br />
zum Beispiel nicht möglich, ein Rechnungsdokument sowohl in einem<br />
Verzeichnis mit Kundenkorrespondenz als auch in einem für Rechnungen vorgesehenen<br />
zu plazieren.<br />
Das Dateisystem, im Sinne der auf dem Datenträger geschriebenen Verwaltungsstruktur,<br />
unterstützt eine solche m-zu-n-Zuordnung in vielen Fällen<br />
durchaus: Die meisten <strong>Desktop</strong>-Systeme pflegen jedoch die Ordner-Metapher,<br />
die ein solches Verhalten nicht erlaubt. Die Unterscheidung der Begriffe ,,Ordner”<br />
und ,,Verzeichnis” scheint haarspalterisch, fördert jedoch einen gewaltigen<br />
Bedeutungsunterschied zu Tage: Während ein Aktenordner die darin<br />
6
einsortierten Dokumente wirklich enthält, beinhaltet ein Verzeichnis lediglich<br />
Verweise auf den eigentlichen Ablageort. Ein Buch über die Tierwelt Afrikas<br />
kann sowohl in einem Buchverzeichnis über Biologie als auch in einer anderen<br />
Liste über den schwarzen Kontinent verzeichnet sein; genauso ist es bei vielen<br />
Dateisystemen möglich, Dateien – nicht jedoch Verzeichnisse – in mehreren<br />
Verzeichnissen zu plazieren.<br />
/<br />
home<br />
max<br />
Rechnungen<br />
Korrespondenz<br />
Musterfirma<br />
Musterfirma<br />
Rechnung 1442 Brief 20083107<br />
Abbildung 3: Hardlinks erlauben die Plazierung von Dateien in mehreren<br />
Verzeichnissen<br />
Jeder Eintrag in einem Verzeichnis wird dabei als Link oder auch Hardlink<br />
bezeichnet; alle Verzeichniseinträge einer Datei sind gleichberechtigt und<br />
voneinander unabhängig: Erst, wenn der letzte Verweis entfernt wird, gilt die<br />
Datei als gelöscht.<br />
Mit Hardlinks ist es also durchaus möglich, eine Art Tagging für Dateien<br />
zu implementieren: Jedes Verzeichnis, dem ein Verweis auf die Datei hinzugefügt<br />
wird, kann als zusätzliches Etikett verstanden werden, das Art und<br />
Inhalt der Datei weiter beschreibt.<br />
Die Verwendung von Hardlinks zur Datenorganisation ist jedoch eingeschränkt:<br />
Die zusätzlichen Verweise lassen sich nicht über Datenträgergrenzen<br />
hinweg erstellen und bieten keine Möglichkeit, direkte Beziehungen zwischen<br />
Dateien auszudrücken. Es ist auch nicht möglich, auf effiziente Art und<br />
Weise alle Hardlinks zu finden, die auf ein bestimmtes Dokument verweisen.<br />
Zudem besteht aufgrund der schlechten Unterstützung in grafischen Benutze-<br />
7
oberflächen das Risiko von Fehlbedienungen und versehentlichen Löschungen,<br />
falls versehentlich der letzte existente Verzeichniseintrag eines Dokuments<br />
entfernt wird.<br />
2.4.2 Inkongruenz von Dateien und Dokumenten<br />
Ein weiteres Argument gegen die Verwendung von Dateisystem-Eigenschaften<br />
zur semantischen Organisation von Datenbeständen liegt in der Tatsache begründet,<br />
dass Dateien und Dokumente nicht zwangsläufig deckungsgleich sein<br />
müssen: Oft enthalten Objekte, die auf Dateisystemebene atomar erscheinen,<br />
aus Anwendungssiche mehrere Dokumente. Klassische Beispiele für diese verborgenen,<br />
inneren Strukturen sind Mailboxdateien oder auch Adressbücher,<br />
die mehrere Informationseinheiten zu einer Datei bündeln. Für Hardlinks sind<br />
diese feingranularen Einheiten nicht greifbar, da Wissen über die Syntax der<br />
Container-Datei erforderlich ist.<br />
/<br />
home<br />
Eingang<br />
max<br />
mbox<br />
Gesendet<br />
Rechnungen<br />
Projekte<br />
Foo<br />
Abbildung 4: Inkongruenz von Dokumenten und Dateien<br />
2.5 Semantisch orientierte Anwendungen<br />
Da semantisches Wissen über einzelne Dokumente auf Betriebs- und Dateisystemebene<br />
nicht verfügbar ist, muss es über spezielle Anwendungen gewonnen<br />
werden. Besonders im Bereich der Mediendaten haben sich Anwendungen<br />
herausgebildet, die sich von der unterliegenden Dateisystemstruktur lösen<br />
und eigene Mechanismen zur Datenorganisation implementieren.<br />
Bekannt ist dieses Vorgehen besonders bei Audio-Abspielprogrammen wie<br />
iTunes, Rhythmbox oder Amarok: Musikstücke werden nicht über das Dateisystem<br />
verwaltet, sondern zu einer koherenten Sammlung hinzugefügt. Die<br />
8
Anwendungen ignorieren bewusst die Verzeichnisstrukturen, aus denen die<br />
Dateien stammen und wandeln den Baum in eine flache Menge um. Indem sie<br />
Metadaten aus den einzelnen Dateien extrahieren und in einer separaten Datenbank<br />
speichern, ermöglichen sie beliebige Anfragen über gemeinsame Eigenschaften<br />
der gewünschten Audio-Dokumente: Aus der Datenbank können<br />
beliebige Teilmengen extrahiert werden, die auf den semantisch orientierten<br />
Attributen der Daten fußen und nicht auf Pfadangaben, deren Aussagekraft<br />
sehr eingeschränkt ist.<br />
Die Verflachung synthetischer Hierarchien zugunsten der Bildung von semantisch<br />
attributierten Objektmengen lässt sich auch auf andere Medientypen<br />
übertragen: Digitale Photos werden bereits bei ihrer Erstellung durch<br />
die Kamera mit zahlreichen Metadaten ausgestattet, die neben technischen<br />
Aspekten – wie Belichtungszeit und Blendenöffnung – die zeitliche und, dank<br />
integrierter GPS-Empfänger in neuen Geräten, räumliche Einordnung erlauben.<br />
Gerade bei photographischen Dokumenten fällt die Einordnung in strikte<br />
Hierarchien oft schwer, da sich selten ein herausragendes Ordnungskriterium<br />
festmachen lässt: Neben Ort und Zeit sind die abgebildeten Objekte oder<br />
Personen oft Ziel einer Suche.<br />
Abbildung 5: Semantisch orientierte Photo-Verwaltung mit F-Spot<br />
Die freie Software F-Spot 1 stellt importierte Photos mit Hilfe eines Zeitstrahls<br />
dar. Zusätzliche semantische Informationen können Bildern in Form<br />
von Tags, also einzelnen Schlagworten, hinzugefügt werden. Tags selbst können<br />
in einer Hierarchie angeordnet werden, so dass zum Beispiel Personen- und<br />
Ortsbezeichnungen in jeweils eigenen Kategorien erscheinen: Dadurch ist es<br />
zum Beispiel möglich, Photos zu selektieren, die eine beliebige Person darstellen<br />
– und mit einem Tags versehen sind, der dieser Kategorie zugeordnet<br />
ist.<br />
1 http://f-spot.org/Main_Page<br />
9
Anwendungsgestützte semantische Ordnung bietet einen Vorgeschmack<br />
auf Dinge, die durch die Loslösung vom starren hierarchischen Ordnungsmodell<br />
möglich sind. Allerdings handelt es sich bei den bekannten Applikationen<br />
nur um Insellösungen: Jede pflegt ihr eigenen Datenbankformat und ist in<br />
sich abgeschottet. Es ist nicht möglich, Musik- und Photo-Dokumente miteinander<br />
zu verknüpfen oder gar aus dritten Anwendungen die Metadaten zu<br />
nutzen.<br />
3 Implementierung des <strong>Social</strong> <strong>Semantic</strong> <strong>Desktop</strong>s<br />
Derartige Insellösungen aufzubrechen und eine semantisch orientierte Zugriffsmethode<br />
über Anwendungsgrenzen hinweg aufzustellen ist eines der<br />
Hauptziele bei der Implementierung des <strong>Semantic</strong> <strong>Desktop</strong>s. An die Position<br />
der strikten hierarchischen Dateisystemstrukturen als primäres Ordnungsinstrument<br />
tritt ein Graph, dessen Knoten aus allen Dokumenten des Anwenders<br />
besteht, dessen Kanten beliebige Beziehungen und Metadaten repräsentieren,<br />
und der von allen semantik-affinen Anwendungen genutzt und gepflegt<br />
wird.<br />
3.1 RDF als Integrationsformat<br />
Als gemeinsames Datenformat hat sich RDF 2 , das vom W3C entworfene<br />
,,Resource Description Framework”, etabliert. Ursprünglich als Metadatenformat<br />
für Webseiten entwickelt, findet es mit einer vielzahl syntaktischer<br />
Ausprägungen Verwendung für zahlreiche Modellierungsaufgaben.<br />
Neben einer XML-basierten Notation hat sich vor allem die N3-Schreibweise<br />
durchgesetzt. RDF-Aussagen sind Dreier-Tupel, die aus Subjekt, Prädikat<br />
und Objekt bestehen. Das Subjekt stellt dabei das Element dar, über das<br />
eine Aussage getroffen wird, deren Art und Ausprägung durch Prädikat und<br />
das dazugehörige Objekt bestimmt werden. Jedes Element des Tripels wird<br />
in Form eines URI 3 dargestellt – mit Ausnahme des Objektes, das auch eine<br />
Zeichenkette sein kann.<br />
Die Verwendung eines URI als primäres Identifikationsmerkmal bietet<br />
Vorteile gegenüber der Verwendung der geläufigeren URL: Jeder gültige URL<br />
stellt gleichzeitig einen validen URI dar, macht gleichzeitig jedoch auch eine<br />
Aussage über die Bezugsmethode, mit Hilfe derer die Ressource erlangt<br />
werden kann. Dies ist jedoch nicht in jedem Fall gewünscht, da zirkulierende<br />
2 http://www.w3.org/RDF/<br />
3 Uniform Resource Identifier<br />
10
Import des Dublin-Core-Namensraumes<br />
@prefix dc: .<br />
// Import benutzerdefinierter Praedikate<br />
@prefix db: .<br />
db:isReplyTo <<br />
file:///home/stefan/Auftrag.pdf>.<br />
db:pictures <<br />
abook:Stefan%20Tomanek>.<br />
dc:title "<br />
Seminarfolien <strong>Social</strong> Retrieval".<br />
Abbildung 6: RDF-Aussagen in N3<br />
Dokumente unter Umständen nicht an einen dedizierten Speicherort gebunden<br />
sind. Es besteht auch kein Zwang, jede Ressource zwingend mit einem<br />
Dokument zu hinterlegen: URIs können auch abstrakte Konzepte darstellen,<br />
was besonders bei der Verwendung als Prädikat zum tragen kommt.<br />
Das in N3-Syntax vorliegende Beispiel (siehe Abbildung 6) trifft verschiedene<br />
Aussagen über dem System bekannte Dokumente und verwendet dabei<br />
Prädikate aus verschiedenen Quellen: Zum einen die bekannten Dublin-Core-<br />
Elemente 4 , in denen ein Standardrepertoire an häufig benötigten Metadaten-<br />
Typen zur Verwendung im Internet zusammengefasst wurde, zum anderen<br />
eine benutzerdefinierte Sammlung spezieller Prädikate. Das System lässt sich<br />
dadurch beliebig für den gewünschten Anwendungsbereich ausbauen – sollen<br />
Metadaten jedoch ausgetauscht werden, sollte man sich auf ein gängiges Vokabular<br />
einigen. Das Prädikat ,,isReplyTo” setzt zwei Dokumente in Relation<br />
zueinander: Die kausale Folge der geschriebenen Rechnung auf den erhaltenen<br />
Auftrag lässt sich so leicht modellieren und abbilden. Ebenso beschreibt das<br />
Verb ,,pictures” das auf einem Photo abgebildete Objekt, indem es einen Eintrag<br />
im lokalen Adressbuch referenziert. Dem bekannten Tagging ähnelt die<br />
Verwendung von Zeichenketten: Im vorliegenden Beispiel nutzt N3 das standardisierte<br />
Dublin-Core-Vokabular, um den Titel eines über eine Prüfsumme<br />
identifizierten Dokuments in der lokalen RDF-Datenbasis abzulegen.<br />
4 http://dublincore.org/<br />
11
3.1.1 Bäume zu Graphen<br />
Durch das Einfügen von RDF-Kanten wandelt sich das hierarchisch strukturierte<br />
Dateisystem in einen gerichteten Graphen, der sich wie eine transparente<br />
Folie über die bestehenden Hierarchien legt (siehe Abbildung 7). Durch<br />
verschiedenartige Prädikate (in der Abbildung durch unterschiedliche Farben<br />
gekennzeichnet) können unterschiedliche Relationen zwischen Dokumenten<br />
gekennzeichnet werden, ebenso stellt das bekannte Tagging eine Untermenge<br />
dar: Tags erwachsen ganz intuitiv aus dem Graphenkonzept, indem das<br />
Objekt durch eine Zeichenkette repräsentiert wird.<br />
Abbildung 7: Transformation einer Dateihierarchie zu einem RDF-Graphen<br />
Im Gegensatz zur dateisystembasierten Ordnung können Dokumente nicht<br />
nur in gemeinsame Kategorien eingeteilt, sondern direkt mit typisierten Relationen<br />
untereinander versehen werden. Ein abgeschickter Brief kann daher<br />
in seinen Metadaten vermerken, dass er eine Reaktion auf eine erhaltene E-<br />
Mail darstellt - die wiederum über eine Kante im RDF-Graphen mit ihrem<br />
Absender im lokalen Adressbuch verknüpft ist. Auf diese Weise lassen sich<br />
Zusammenhänge zwischen Dokumenten, Akteuren und Konzepten schnell<br />
und in maschinell verarbeitbarer Weise sichern.<br />
Ganz ähnlich der Vision ,,Memex” ist eine semantik-affine Oberfläche<br />
durch geschickte Nutzung der Metadaten in der Lage, zur Benutzersituation<br />
passende Dokumente zu präsentieren und so das Informationsbedürfnis des<br />
Anwenders auf kognitiv hoher Ebene zu füllen.<br />
12
3.2 Herkunft der Metadaten<br />
Doch woher stammen die Metadaten, die für eine solche Adaption notwendig<br />
sind? Im einfachsten Falle bringen Dokumente bereits leicht erfassbare und<br />
klar strukturierte Daten mit. Dies ist vor allem bei Mediendokumenten wie<br />
Ton- und Bildaufnahmen der Fall. Bei Eintritt in das System müssten die<br />
inherenten Meta-Informationen aus den Dateien extrahiert und in den systemweiten<br />
RDF-Graphen eingefügt werden. Bestimmte Informationen lassen<br />
sich nur schwer automatisiert erkennen; die Erkennung von Bildinhalten<br />
und die dazugehörige Annotation wird weiterhin dem menschlichen Benutzer<br />
überlassen bleiben.<br />
Viele Metainformationen lassen sich jedoch aus den Handlungen des Benutzers<br />
selbst ableiten: Öffnet er zum Beispiel zwei verschiedene Dokumente<br />
gleichzeitig, so lässt sich aus dieser Handlung eine inhaltliche Relation der<br />
beiden herleiten. Ein weiteres Beispiel ist die Sammlung von Bewegungsprofilen<br />
über einen tragbaren GPS-Empfänger während des Microsoft-Projektes<br />
,,MyLifeBits” 5 : Korrelationen zwischen den Aufenthaltsorten und den danach<br />
resultierenden Informationsbedürfnissen und Handlungen sind ebenfalls<br />
zur Gruppierung verwandter Dokumente von Nutzen.<br />
Eine primäre Quelle zusätzlicher Informationen wird sicherlich die Verwendung<br />
semantik-affiner Programme darstellen, die entsprechende Meta-<br />
Informationen direkt bei der Erstellung oder Bearbeitung von Dokumenten<br />
gewinnen und in den lokalen Graphen einfügen.<br />
3.3 SPARQL<br />
Um Abfragen auf einem RDF-Graphen durchzuführen, entwickelte das RDF-<br />
Data-Access-Arbeitsgruppe des W3C die Anfragesprache SPARQL (,,Simple<br />
Protocol and RDF Query Language”) 6 , die Anfang des Jahres 2008 den<br />
Status einer offiziellen W3C-Empfehlung[6] erreichte. Die Sprache benutzt<br />
zur Selektion Anfrage-Tripel, die gegen die Tupel des RDF-Graphen geprüft<br />
werden. Mit Hilfe gleichbenannter Variablen innerhalb der Anfrage können<br />
– analog zum Tupelkalkül – verschiedene Kanten des Graphen miteinander<br />
verbunden werden, so dass auch komplexe Anfragen durch verknüpfung verschiedener<br />
Informations- und Datenquellen möglich sind.<br />
So durchsucht die Anfrage in Abbildung 8 den lokalen RDF-Graphen<br />
nach allen bekannten Photos, die eine weibliche Person zeigen, deren Telefonnummer<br />
im Adressbuch Verzeichnet ist; dieses Beispiel zeigt, wie bisher<br />
5 http://research.microsoft.com/barc/mediapresence/MyLifeBits.aspx<br />
6 http://www.w3.org/TR/rdf-sparql-query/<br />
13
PREFIX db: <br />
PREFIX ab: <br />
SELECT ?photo ?phone<br />
WHERE {<br />
?photo db:pictures ?person.<br />
?person ab:hasGender ab:female;<br />
ab:hasPhoneNumber ?phone.<br />
}<br />
Abbildung 8: Graph-Anfragen mit SPARQL<br />
vollkommen disjunkte Datenspeicher durch SPARQL und die gemeinsame<br />
RDF-Datenbasis miteinander vernetzt werden.<br />
3.4 Soziale RDF-Datenbanken<br />
Die wenigsten Dokumente bleiben jedoch exklusiv einem einzelnen Benutzer<br />
vorbehalten: Arbeit findet meist in Gruppen statt, ebenso werden Fotos und<br />
andere Mediendateien oft im kleinen oder auch größeren Kreis ausgetauscht.<br />
Verlässt ein Dokument – zumindest als Kopie – das lokale System, zum Beispiel,<br />
indem es per E-Mail verschickt wird, wird es auch aus dem mühevoll<br />
erstellten RDF-Graphen gerissen. Die Kanten, die auf dem Ursprungssystem<br />
noch wertvolle Kontextinformationen geliefert haben, verschwinden auf<br />
dem dem Empfänger: Selbst wenn dieser eine ähnliche semantisch orientierte<br />
Oberfläche nutzt, erscheint das neue Dokument zunächst ,,nackt”.<br />
Gerade in Arbeitsgruppen, die oft Informationen austauschen, muss daher<br />
ein Weg gefunden werden, die semantischen Verknüpfungen auch über<br />
den Transportweg hinaus zu erhalten; genauso sollen Anwender von neuen<br />
Relationen profitieren, die andere aufgrund der ihnen vorliegenden Daten erzeugen.<br />
Diese soziale Komponente erfordert losgelöst von der Übermittlung<br />
der eigentlichen Dokumente einen Austausch auf Metadatenebene.<br />
Ein naheliegender Ansatz besteht darin, den lokalen RDF-Graphen einer<br />
zentralen instanz gegenüber offenzulegen und von dieser indizieren zu lassen;<br />
anfragende Systeme können Metainformationen über ihnen vorliegende Dokumente<br />
anhand des eindeutigen URIs von dieser zentralen Stelle erfragen.<br />
Die Verwendung einer zentralen Sammelstelle, die alle lokalen Graphen in<br />
sich vereinigt, bringt jedoch Probleme mit sich: Mit wachsender Benutzerzahl<br />
wird es stetig schwieriger, den zentralen Index aktuell zu halten, ebenso<br />
widerspricht das Gebot der Datensparsamkeit einer solchen Datenzusammen-<br />
14
allung.<br />
Eine Alternative zu einer zentralistischen RDF-Suchmaschine stellen Peerto-Peer-Systeme<br />
dar. Das Projekt Edutella 7 nutzt dazu ein unstrukturiertes<br />
Netz, wie es vom Filesharing-System Gnutella bekannt ist. Neue Knoten, die<br />
dem Netz beitreten möchten, stellen eine Verbindung zu mindestens einem<br />
System her, das bereits Teil des Netzes ist; sie selbst werden dabei wieder<br />
Anlaufpunkt für andere Klienten, die das gleiche Anliegen haben. Auf diese<br />
Weise entsteht eine vermaschte Struktur, in der jedes System auf Anfragen<br />
nach seiner Datenbasis antworten kann.<br />
Jeder Knoten leitet eingehende Anfragen an alle Knoten weiter, zu denen<br />
er eine Verbindung hält: So breiten sie sich wellenförmig durch das Netz<br />
aus. Eventuelle Antworten werden auf direktem Wege dem ursprünglichen<br />
Fragesteller übermittelt. Um die Enstehung endloser Zyklen zu vermeiden,<br />
ist jede Anfrage mit einer maximalen Lebenszeit (TTL) versehen, die bei<br />
jeder Weiterleitungsstation dekrementiert wird.<br />
?<br />
Abbildung 9: Informationssuche mit Edutella<br />
Die unstrukturierte Natur der Anfrageübermittlung und -verarbeitung<br />
bringt Probleme bei der Informationssuche mit sich: So ist für den Anfragesteller<br />
nicht ersichtlich, ob es zu einer Anfrage keine Ergebnistupel im Netz<br />
gibt, oder ob die Anfrage aufgrund zu geringer TTL die betroffenen Knoten<br />
7 http://www.edutella.org/<br />
15
nie erreicht hat; ebenso kann er nicht entscheiden, ob seine Anfrage noch<br />
im Netz zirkuliert, oder ob er das Warten auf zusätzliche Ergebnistupel abbrechen<br />
kann. Abbildung 9 illustriert dieses Problem: Bei der vorliegenden<br />
Netzstruktur erreichen erst Anfragen mit einer TTL von mindestens 4 das<br />
System mit der gesuchten Information – begrenzt das Startsystem seine Traversierungstiefe<br />
auf 3, durchlaufen zwar 8 Nachrichten das Netz, ohne jedoch<br />
den Zielknoten erreichen zu können.<br />
Eine Alternative zur unstrukturierten Netzbildung Edutellas und dem<br />
zentralistischen Ansatz stellt die Bildung eines verteilten Indizes dar: Der von<br />
Min Cai und Martin Frank am Information Sciences Institute vorgeschlagene<br />
Ansatz 8 kommt ohne eine zentrale Instanz aus, erlaubt aber dennoch das<br />
sichere und schnelle Auffinden relevanter Tupel.<br />
Jeder teilnehmende Knoten im Netz wird dazu mit einer eindeutigen<br />
Identifikationsnummer versehen; alle teilnehmenden Knoten werden in einem<br />
Kreis angeordnet, und jeder teilnehmer erhält Kenntnis über die IDs<br />
der Systeme, die sich direkt vor ihm befinden, sowie über weitere Systeme<br />
mit exponentiell steigenden Kennziffern. Die Tripel, die in das System<br />
eingebracht werden, durchlaufen mit jeder ihrer Komponenten eine Hash-<br />
Funktion, die den Wert von Subjekt, Prädikat und Objekt jeweils auf den<br />
Zahlenraum der Knoten-IDs abbildet. So werden für jedes Tripel drei Systemkennungen<br />
ermittelt, deren nächstmöglicher Nachfolger im Netzring für<br />
das Tripel verantwortlich sind.<br />
S : P : O<br />
Abbildung 10: Verteilte Metadaten-Datenbank mit RDFPeers<br />
8 ,,RDFPeers: A Scalable Distributed RDF Repository based on A Structured Peer-to-<br />
Peer Network”, 2004<br />
16
Abbildung 10 zeigt, wie für Subjekt, Pärdikat und Objekt eines Tripels<br />
jeweils ein verantwortlicher Knoten ermittelt und das Tupel an diesen übergeben<br />
wird. Jedes Tripel ist demnach auf drei Systemen des Netzes gespeichert:<br />
Ein anfragender Rechner kann aus den gegebenen Parametern ebenfalls über<br />
die Hash-Funktion die Knoten-ID berechnen, die für die gesuchten Tupel<br />
zuständig ist. Aufgrund der exponentiellen Datenstruktur kann eine solche<br />
Anfrage den Ring mit geringem Aufwand traversieren und das zuständige System<br />
schnell erreichen, ohne wie beim Edutella-Ansatz alle Knoten durchlaufen<br />
zu müssen. Ist zumindest eine einzige Komponente des gesuchten Tripels<br />
vorgegeben, lassen sich die Ergebnisse bei einer Knotenzahl von n mit einem<br />
Aufwand von O(log(n)) ermitteln. Lediglich eine Anfrage ohne Parameter,<br />
also das vollständige Aufzählen aller Tripel, erfordert die Kontaktierung jedes<br />
einzelnen Netzknotens und birgt daher die lineare Komplexität O(n).<br />
Im Gegensatz zu Edutella lässt sich jedoch aufgrund der Ringstruktur des<br />
Netzes entscheiden, wann sämtliche Systeme kontaktiert wurden.<br />
3.5 Der zukünftige Weg<br />
Wie bei vielen Objekten der aktuellen Forschung und Entwicklung existieren<br />
auch im Bereich des <strong>Social</strong> <strong>Semantic</strong> <strong>Desktop</strong>s verschiedene Interpretationen<br />
und Strömungen: So haben einige Projekte nicht nur das Ziel, Anwendungen<br />
und Oberflächen auf eine gemeinsame Metadatenbasis zu stellen, sondern<br />
die verschiedenen Applikationen direkt zu einer koherenten Oberfläche<br />
zu verschmelzen, um technisch-syntaktische Unterschiede zwischen verschiedenen<br />
Dateiformaten zugunsten einer inhaltlich-semantischen Betrachtungsweise<br />
zu verdrängen. So tragen OpenOffice-Writer-Dokumente, PDF-Dateien<br />
und HTML-Seiten die gleichen Informationstypus, werden jedoch von jeweils<br />
verschiedenen und unterschiedlichen Programmen verarbeitet. Die amalgamisierung<br />
verschiedener Anwendungen ist jedoch ein radikaler Schnitt, der<br />
aufgrund des stark divergenten Funktionsumfangs vieler Applikationen nur<br />
schwer ohne Verluste essentieller Funktionen möglich ist.<br />
Ein weiterer Aspekt des <strong>Social</strong> <strong>Semantic</strong> <strong>Desktop</strong> besteht in der Erleichterung<br />
der kolaborativen Nutzung von Dokumenten: Es soll sehr einfach<br />
möglich sein, ein Dokument für die Nutzung durch andere freizugeben. Auf<br />
derzeitigen Systemen ist dies oft eine Frage des Speicherortes: Damit Interessierte<br />
die Datei beziehen können, muss sie sich in einem freigegebenen Verzeichnis<br />
oder auf einem Webserver befinden. Im Kontext des <strong>Social</strong> <strong>Semantic</strong><br />
<strong>Desktop</strong>s soll die Kolaboration eine Eigenschaft des Dokumentes werden und<br />
nicht seines Speicherortes: Die technischen Aspekte sollen dem Benutzer dazu<br />
weitgehend verborgen bleiben.<br />
Der Einfluss semantischer Gesichtspunkte sollte auch Einzug in Microsofts<br />
17
Betriebssystem Windows Vista halten: Unter dem Namen WinFS kündigte<br />
Microsoft eine Datenbankschicht an, die zusätzliche Attribute über Dateien<br />
vorhalten sollte. Doch mit dem Erscheinen Vistas wurde WinFS zunächst verschoben,<br />
anschließend komplett abgesagt; es soll in Zukunft unter Umständen<br />
als Teil des Microsoft SQL-Servers veröffentlicht werden.<br />
Ein wichtiger Anlaufpunkt ist das Projekt NEPOMUK (,,Networked Environment<br />
for Personalized, Ontology-based Management of Unified Knowledge”)<br />
9 , das Forscher, Software-Entwickler und die Industrie zusammenbringen<br />
und eine gemeinsame Basis zur Entwicklung des <strong>Social</strong> <strong>Semantic</strong><br />
<strong>Desktop</strong>s entwickeln möchte. Die Kombination offener und bereits heute<br />
verfügbarer Technologien – Peer-to-Peer-Systeme, Soziale Netze, Semantisch<br />
orientierte Oberflächen – soll zu einer übergreifenden Lösung führen. Eine erste<br />
Implementierung der von NEPOMUK vorgeschlagenen Richtlinien[7] findet<br />
in der freien <strong>Desktop</strong>-Oberläche KDE (,,KDE <strong>Desktop</strong> Environment”) 10<br />
statt: Die kürzlich veröffentlichte Version 4 unterstützt bereits das Taggen<br />
von Dateien. Eine weitere Referenzimplementierung stellt das Projekt ,,gnowsis”<br />
11 des Deutschen Forschungszentrums für künstliche Intelligenz (DFKI)<br />
dar.<br />
4 Fazit<br />
Die schrittweise Evolution der Benutzeroberfläche zu einer semantisch orientierten<br />
Sicht bietet viele neue Möglichkeiten, Informationen und Daten zu<br />
organisieren und zu vernetzen. Die klassischen Ordnungsparadigmen sind der<br />
Vielfältigkeit moderner Datensammlungen mit ihrer Vielzahl unterschiedlicher<br />
Datentypen nur schlecht gewachsen. Die multiplen Ordnungsmerkmale,<br />
die viele Dokumente bieten, lassen sich nur schwer in den archaisch wirkenden<br />
Baumstrukturen der gängigen Dateisysteme abbilden. Ebenso erlaubt die<br />
direkte Verknüpfung voneinander abhängiger Dateien den Nachvollzug ihrer<br />
Entstehung und der damit verbundenen Beweggründe. Durch ein- und ausgehende<br />
Kanten im RDF-Graphen lässt sich ein ,,Umriss” eines Dokumentes<br />
zeichnen, der dem semantisch stark eingeschränkten Dateinamen und -pfad<br />
weit überlegen ist: Die Verflachung und Auflösung der strikten Hierarchien<br />
ist gleichzeitig mit der Verdichtung des beschreibenden Netzes verbunden,<br />
dass Dateien und Dokumente miteinander verknüpft.<br />
Der Nutzen der Metadaten darf jedoch auch nicht überschätzt werden;<br />
während viele Dokumentenformate ihre Metadaten sehr einfach preisgeben<br />
9 http://nepomuk.semanticdesktop.org/<br />
10 http://www.kde.org/<br />
11 http://www.gnowsis.org/<br />
18
und automatisch verarbeiten lassen, sind andere Datenformate ohne menschliche<br />
Unterstützung nur schwer aufzuschlüsseln: Ein E-Mail-Programm kann<br />
den lokalen RDF-Graphen sehr einfach mit Kanten zwischen E-Mails, dem<br />
Adressbuch und verschickten Dateien anreichen – Bilder und Photos mit<br />
beschreibenden Tags auszustatten, wird jedoch weiterhin dem Benutzer obliegen.<br />
Dabei kommt die soziale Komponente zum tragen, die bereits aus<br />
Online-Diensten wie Flickr 12 oder Youtube 13 bekannt ist, in denen Tags auch<br />
von anderen Personen beigesteuert werden. Der Erfolg einer solchen Auslagerung<br />
hängt jedoch vom Interesse ab, die jene Personen den Dokumenten<br />
entgegenbringen – ebenso muss die Aufwandsschwelle möglichst gering sein,<br />
um möglichst wenige Benutzer von ihrem Beitrag abzuhalten. Je geringer<br />
jedoch allgemeine Attraktivität und subjektiv betrachteter Mehrwert sind,<br />
desto geringer fällt die Ausbeute an semantisch wertvollen Attributionen aus;<br />
gerade bei Dokumenten, die nur einer kleinen Personengruppe zugänglich gemacht<br />
werden sollen, entfällt logischerweise der Erkenntniszugewinn durch<br />
die vielen Namenlosen.<br />
Radikale Herangehensweisen, die die komplette Verschmelzung aller Anwendungen<br />
zu einer koherenten Oberfläche fordern, bringen natürlich einen<br />
Bruch mit bekannten Bedienungsparadigmen mit sich: Es muss sich zeigen,<br />
ob die dadurch zu erringenden Vorteile diesen großen Schritt rechtfertigen. In<br />
näherer Zukunft erscheint die evolutionäre Integration semantischer Komponenten<br />
in bestehende und erprobte Anwendungen der erfolgsversprechendere<br />
Weg.<br />
Die immense Ansammlung von Daten, die sich im Laufe der Zeit im RDF-<br />
Graphen ansammelt, kann ein Risiko darstellen: Besonders die hintergründig<br />
und ohne Benutzeraufforderung erfassten Metadaten erlauben weitreichende<br />
Einblicke in Arbeitsfeld und -weise des Anwenders und machen ihn seinem<br />
Computer gegenüber in gewisser Weise ,,gläsern”: Der Schutz dieser Informationen,<br />
deren Art und Umfang der Anwender oft selbst nicht überblicken<br />
kann, muss gewährleistet sein. Ein Diebstahl dieser Informationen würde<br />
zu erheblichen Datenschutzproblemen führen, ein Problem, das sich auch<br />
bei der gemeinsamen Nutzung von Metadaten stellt: Hier müssen effektive<br />
Schutzmechanismen geschaffen werden, um den Anwender nicht digital zu<br />
entblößen.<br />
Trotz der damit verbundenen Risiken und Probleme stellt der <strong>Social</strong> <strong>Semantic</strong><br />
<strong>Desktop</strong> eine hochinteressante Vision dar, deren Verfolgung in jedem<br />
Fall ein lohnendes Ziel für die Entwicklung zukünftiger <strong>Desktop</strong>- und <strong>Informationssysteme</strong><br />
darstellt. Seine Einführung wird nicht in Form einer Revo-<br />
12 http://www.flickr.com/<br />
13 http://youtube.com/<br />
19
lution erfolgen, sondern einzelne Komponenten des Gesamtkonzeptes werden<br />
nach und nach die bekannten Paradigmen ergänzen.<br />
Literatur<br />
[1] Stefan Decker and Martin Frank. The social semantic desktop. Technical<br />
report, Digital Enterprise Research Institute, 2004.<br />
[2] Leo Sauermann, Ansgar Bernardi, and Andreas Dengel. Overview and<br />
outlook on the semantic desktop, 2005.<br />
[3] Tony Buzan. The mind map book. Penguin Books, 1996.<br />
[4] John D. Novak. Learning Science in the Schools: Research Reforming<br />
Practice, chapter ,,Concept Mapping: A Strategy for Organizing Knowledge”,<br />
pages 229–245. Lawrence Erlbaum Associates, 1995.<br />
[5] Vannevar Bush. As we may think. The Atlantic Monthly, 176, 1945.<br />
[6] W3C. Sparql protocol for rdf: W3c recommendation 15th January 2008.<br />
http://www.w3.org/TR/2008/REC-rdf-sparql-protocol-20080115/.<br />
[7] The NEPOMUK Project - On the way to the <strong>Social</strong> <strong>Semantic</strong> <strong>Desktop</strong>,<br />
2007.<br />
20