28.02.2013 Aufrufe

Sharing Knowledge: Scientific Communication - SSOAR

Sharing Knowledge: Scientific Communication - SSOAR

Sharing Knowledge: Scientific Communication - SSOAR

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Probleme der Integration digitaler Bibliothekssysteme 53<br />

� ZPID: Nachbild - IZ: visuelle Wahrnehmung<br />

� ZPID: Recency-Effekt - SWD: Positionseffekt<br />

� ZPID: Wernicke-Syndrom - DIPF: Sprachstoerung<br />

� Damit in engem Zusammenhang finden sich Begriffe, deren Semantik zwar<br />

eine Art Ordnungsrelation nahe legt, die aber nicht durch eine einfache<br />

Über-/Unterordnung repräsentierbar ist:<br />

� ZPID: Kastrationsangst - IZ: Psychoanalyse<br />

� ZPID: Introjektion - IZ: Psychoanalyse<br />

� ZPID: Katharsis - IZ: Psychoanalyse<br />

Unter solchen Voraussetzungen ist es keine triviale Aufgabe, den vom Benutzer<br />

intendierten semantischen Raum adäquat zu transferieren. Dieser Transfer ist<br />

nun das Anliegen der Behandlung semantischer Heterogenität: Die Such-Anfrage<br />

eines Benutzers muss – ohne dessen Zuarbeit - so effizient wie möglich gegen<br />

viele verschiedene (Fach-) Datenbanken gestellt werden können.<br />

Lösungsmodelle<br />

Die bisherigen Ansätze, um eine semantische Umsetzung vom Ausgangs- in<br />

den Zielraum zu konstruieren, sind<br />

� Statistische Modelle (Häufigkeitsanalysen, Co-Occurrence Analysis / Bedingte<br />

Wahrscheinlichkeiten, [11]).<br />

� Neuronale Netzwerk-Modelle (prinzipiell analog den Inferenzstatistischen<br />

Modellen: Multiple Regression z.B. über Hidden Layer, [11]).<br />

� Intellektuell erarbeitete Konkordanzen (gewichtete Graphen als Übergang<br />

zwischen Thesauri: „Cross-Konkordanzen“, [7]).<br />

Klassische Inferenzstatistische Modelle, wie auch ihre modernen, neuronal modellierenden<br />

Nachfolger, arbeiten prinzipiell mithilfe der Analyse bedingter<br />

Wahrscheinlichkeiten: Über das gemeinsame Auftreten von Termen aus verschiedenen<br />

Thesauri bei der Verschlagwortung einer bestimmten Publikation<br />

schließen sie auf semantische Zusammenhänge zwischen eben diesen Termen.<br />

Als Erweiterung der gebräuchlichen statistischen Ansätze (z.B. der Multiplen<br />

Regressionsanalyse), die das Datenmaterial in geschlossener Form analysieren,<br />

modellieren die sog. Neuronalen Netzwerke mithilfe inkrementellen Lernens:<br />

idealerweise entsteht dabei eine robuste und flexible Repräsentation der Zusammenhänge<br />

in den Daten.<br />

Maschinenbasierte Ansätze haben natürlich den großen Vorteil automatischer<br />

Durchführbarkeit und scheinen im Hinblick auf Wartungs- und damit<br />

Kosteneffizienz die bessere Wahl zu sein. Um aber zufrieden stellende Ergebnisse<br />

liefern zu können, sind jedoch große Mengen parallel verschlagworteter

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!