11.03.2014 Aufrufe

XML + Directory Server - Fakultät für Informatik und ...

XML + Directory Server - Fakultät für Informatik und ...

XML + Directory Server - Fakultät für Informatik und ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>XML</strong> + <strong>Directory</strong> <strong>Server</strong><br />

unter der Leitung von<br />

Prof. Dr. rer. nat. Cosima Schmauch<br />

Prof. Dipl. Inform. Sissi Closs


1 Einleitung<br />

Dieses PDF-Dokument wurde von Torsten Fellhauer als Bestandteil seiner<br />

Diplomarbeit erstellt. Das Dokument basiert auf der Projektwebseite des<br />

Forschungsprojektes "<strong>XML</strong> + <strong>Directory</strong> <strong>Server</strong>". Mit Hilfe von XSL-Stylesheets wurde<br />

aus einer zentralen <strong>XML</strong>-Datei eine Formatting Objects-Datei erstellt, die durch den<br />

FO-Prozessor FOP des Apache <strong>XML</strong> Projekts zu einem PDF-Dokument<br />

umgewandelt wird.<br />

2 Kontaktinformationen<br />

Sie finden uns in der in der Fachhochschule Karlsruhe, Gebäude LI, Raum 139.<br />

Auf der Website der Fachhochschule Karlsruhe finden Sie einen Lageplan .<br />

Unsere Adresse lautet<br />

Software Labor der Fachhochschule Karlsruhe<br />

<strong>XML</strong> + <strong>Directory</strong> <strong>Server</strong><br />

Moltkestraße 30<br />

76133 Karlsruhe<br />

Tel: 0721/925-2316<br />

Fax: 0721/925-2361<br />

Ihre Ansprechpartner<br />

Prof. Dr. rer. nat. Cosima Schmauch<br />

Prof. Dipl. Inform. Sissi Closs<br />

Seite 2


3 Projektbeschreibung<br />

Auch Hochschulen kämpfen mit der Dokumentenflut, die sich vor allem aus ihren<br />

Präsentationen im World Wide Web <strong>und</strong> den nach wir vor zahlreichen<br />

Veröffentlichungen in Papierform ergeben. Waren früher nur ein<br />

Vorlesungsverzeichnis <strong>und</strong> die Prüfungsordnung erhältlich, wird heute jede Art von<br />

Information veröffentlicht, angefangen von der Telefonnummer des Dekans einer<br />

Fakultät oder eines Fachbereichs über das Vorlesungsangebot der Hochschule bis<br />

zu den laufenden Aktivitäten eines Forschungsprojekts. Je nach Medium werden<br />

verschiedene Sprachen <strong>und</strong> Formate verwendet, HTML, PS, TeX, oder RTF,<br />

MS-Word-Format <strong>und</strong> PDF.<br />

Die Dokumente haben häufig gleiche Inhalte bzw. Teilinhalte <strong>und</strong> auch ähnliche<br />

Strukturen, werden aber wegen der verschiedenen Formate mehrfach erstellt <strong>und</strong><br />

gepflegt. Es ist also naheliegend ihre Inhalte von den Formaten zu trennen <strong>und</strong> sie<br />

erst bei Bedarf wieder mit der Darstellungsinformation zusammen zu führen. <strong>XML</strong> mit<br />

seinen Ergänzungen zur Praesentation wie Cascading Style Sheets <strong>und</strong> eXtensible<br />

Style Sheet Language XSL bietet sich daher auch hier als Mittel zur Strukturierung<br />

an. Die einmal definierten Strukturelemente werden je nach Verwendungszweck <strong>und</strong><br />

Medium mit der angemessenen Layout-information verknuepft.<br />

<strong>XML</strong>-Dokumente sind Texte <strong>und</strong> werden in Textdateien gespeichert. Ihre Pflege<br />

bedarf also einiger Hilfsmittel, beispielsweise zur Erstellung wohlgeformter<br />

Dokumente, zur Validierung gegen eine Dokument-Typ-Definition, zur Konvertierung<br />

in andere Formate, zur Generierung von Dokumenten aus Datenbankinhalten <strong>und</strong><br />

zur Versionierung. Dazu gibt es inzwischen Werkzeuge wie <strong>XML</strong>-Editoren,<br />

Transformatoren <strong>und</strong> Zugriffs- <strong>und</strong> Versionskontrollsysteme.<br />

Damit noch nicht gelöst ist jedoch die Verwaltung der <strong>XML</strong>-Texte. Aufgaben wie<br />

red<strong>und</strong>anzfreie Ablage, Versionierung, Zugriffsschutz stehen auch hier an. Das sind<br />

Aufgaben, die klassischerweise mit einer Datenbank gelöst werden können. Der<br />

nächste Schritt besteht daher darin, beide Technologien zusammen zu bringen <strong>und</strong><br />

<strong>XML</strong>-Dokumente bzw. ihre einzelnen Elemente in einer Datenbank zu speichern. Aus<br />

Daten in der Datenbank sollen dann wieder neue Dokumente generiert werden<br />

können.<br />

Ein Beispiel verdeutlicht die Idee: aus detaillierten Beschreibungen der Fachbereiche<br />

einer Hochschule werden Kurzbeschreibungen für Pressemitteilungen oder eine<br />

Hochschulbroschüre generiert. Einleitungen <strong>und</strong> Zusammenfassungen von<br />

Seite 3


Studienarbeiten, Diplomarbeiten <strong>und</strong> Tagungsbeiträgen werden zum Abschlußbericht<br />

eines Forschungsprojekts zusammengestellt.<br />

Diese Beispiele zeigen die Anforderungen, die sich für an Dokumenten-Datenbanken<br />

stellen: die Struktur der Inhalte soll erhalten bleiben, damit Dokumententeile<br />

identifiziert, selektiert <strong>und</strong> mit anderen Dokumententeilen zu einem neuen Dokument<br />

kombiniert werden können.<br />

Es ist naheliegend, zunächst die derzeit meist verwendeten<br />

Datenbankmanagementsysteme wie relationale <strong>und</strong> objektorientierte auf ihre<br />

Brauchbarkeit im Zusammenhang mit <strong>XML</strong> zu prüfen. Weiterhin soll aber auch<br />

untersucht werden, wie gut sich <strong>Directory</strong> <strong>Server</strong>, die ursprünglich für Adressbücher<br />

entwickelt wurden, zur Speicherung von <strong>XML</strong>-Dokumenten eignen.<br />

Für den Verwaltungsbereich, wie er typischerweise an der Hochschule vorkommt,<br />

werden geeignete DTDs definiert, um eine effiziente Dokumentenverwaltung zu<br />

konzipieren. Zur Erprobung der gef<strong>und</strong>enen Lösungsansätze werden die Konzepte<br />

für die Daten <strong>und</strong> Dokumentationen eines Fachbereichs der Hochschule umgesetzt<br />

<strong>und</strong> später auf die Dokumentation der gesamten Hochschule übertragen <strong>und</strong> seine<br />

Anwendbarkeit in weiteren vergleichbaren Bereichen gezeigt werden.<br />

3.1 Themenbereiche<br />

Das Forschungsprojekt untersucht verschiedene in sich abgeschlossene<br />

Themenbereiche. Zur Erzielung eines Gesamtnutzens werden diese Bereiche über<br />

Schnittstellen miteinander verb<strong>und</strong>en. Unsere Kernthemen sind auf dieser Seite<br />

beschrieben.<br />

Speichern von <strong>XML</strong>-Dokumenten in <strong>Directory</strong> <strong>Server</strong>n<br />

Es gibt bis heute erst wenige sogenannte native <strong>XML</strong>-Datenbanken. Dagegen sind<br />

relationale <strong>und</strong> objektorientierte Datenbanken zur Datenhaltung sehr verbreitet. Auch<br />

<strong>Directory</strong> <strong>Server</strong> werden für organisatorische Unternehmensdaten immer häufiger<br />

eingesetzt. Wir untersuchen die Eignung dieser "herkömmlichen"<br />

Datenbanksysteme, speziell die der <strong>Directory</strong> <strong>Server</strong>, für die Speicherung von<br />

<strong>XML</strong>-Dokumenten <strong>und</strong> führen vergleichende Performance-Tests durch.<br />

Seite 4


DTD-Entwicklung für die Präsentation der Fachhochschule<br />

Wie jedes andere Unternehmen auch sieht sich die Fachhochschule mit dem<br />

Problem konfrontiert, dieselben Informationen, die sie in Web-Seiten <strong>und</strong> in<br />

unterschiedlicher Form in Broschüren, Faltblättern, Studienordnungen <strong>und</strong> anderen<br />

gedruckten Dokumenten veröffentlicht, möglichst red<strong>und</strong>anzfrei zu verwalten. Eine<br />

Trennung von Inhalt <strong>und</strong> Layout löst dieses Problem, erfordert jedoch eine<br />

Strukturierung des Inhalts mittels Konstrukten, an die Layout-Angaben geknüpft<br />

werden können. Wir verwenden für die Strukturierung <strong>XML</strong> (eXtensible<br />

Markup-Language) <strong>und</strong> für die Layouterstellung XSL (eXtensible Stylesheet<br />

Language). Die in den <strong>XML</strong>-Dokumenten verwendbaren Strukturelemente definieren<br />

wir in DTDs (Document Type Definition).<br />

<strong>XML</strong> <strong>und</strong> ergänzende Sprachen - Standardisierungen <strong>und</strong><br />

Entwicklungswerkzeuge<br />

Mit wachsender Verbreitung von <strong>XML</strong> steigen auch die Anforderungen an die<br />

Verwendungszwecke. Diesen begegnet das W3C (World Wide Web Consortium) mit<br />

der Standardisierung ergänzender Sprachkonzepte. Dies sind beispielsweise XLink,<br />

zur Verknüpfung von <strong>XML</strong>-Dokumenten, XPath zur Navigation in <strong>XML</strong>-Dokumenten,<br />

XPointer zur Festlegung von Ankern in einem <strong>XML</strong>-Dokument, XSL zur<br />

Layout-Beschreibung, XSLT zur Transformation von <strong>XML</strong>-Dokumenten, <strong>XML</strong> Query<br />

zur Formulierung von Anfragen an ein <strong>XML</strong>-Dokument <strong>und</strong> Scalable Vector Graphics<br />

(SVG) für die Erstellung vektororientierter 2-D-Graphiken. Für Ihre Anwendung<br />

empfiehlt es sich, Werkzeuge, wie <strong>XML</strong>- <strong>und</strong> XSL-Editoren, XSLT-Prozessoren <strong>und</strong><br />

<strong>XML</strong>-Datenbanken zu verwenden. Wir erstellen eine Übersicht zu diesen<br />

Enwicklungswerkzeugen.<br />

Seite 5


4 Projektorganisation<br />

Das vom September 1999 bis Februar 2001 laufende Projekt "<strong>XML</strong> + <strong>Directory</strong><br />

<strong>Server</strong>" wird durchgeführt vom Software Labor der Fachhochschule Karlsruhe.<br />

Unterstützung erhält das Projekt vom B<strong>und</strong>esministerium für Bildung <strong>und</strong> Forschung<br />

beteiligte Einrichtungen<br />

Fachbereich Sozialwissenschaften<br />

Fachbereich Wirtschaftsinformatik<br />

Institut für Innovation <strong>und</strong> Transfer<br />

Projektmitarbeiter<br />

Mitarbeiter<br />

Aufgaben<br />

Cosima Schmauch, Prof. Dr. rer. nat. Projektleitung<br />

Sissi Closs, Prof. Dipl. Inform. Projektleitung<br />

Reza Waladkhani, Dipl. Inform. (FH) Administration, PC-Pool, <strong>Directory</strong> <strong>Server</strong><br />

Christian Ey, Dipl. Inform. (FH) Storing <strong>XML</strong> Documents in <strong>Directory</strong> <strong>Server</strong>s<br />

Torsten Fellhauer, Dipl. Inform. (FH) Managing <strong>XML</strong> Documents with <strong>Directory</strong> <strong>Server</strong>s<br />

Iris Fibinger, Dipl. Ing. (FH)<br />

Scalable Vector Graphics<br />

Martin Rechner, Dipl. Ing. (FH) DTD, <strong>XML</strong>, XLink, XSLT-Stylesheets, Projektwebsite<br />

Erik Mueller<br />

Analyse des Tamino Information <strong>Server</strong>s der Software AG<br />

Dirk Wiltzsch<br />

DTD für die Fachhochschulverwaltung<br />

Philibert Odjo, Dipl. Inform. (FH) <strong>Directory</strong> <strong>Server</strong>, Installation <strong>und</strong> Gr<strong>und</strong>lagenarbeit<br />

Jochen Wünstel, Dipl. Inform. (FH) <strong>Directory</strong> <strong>Server</strong>, Installation <strong>und</strong> Gr<strong>und</strong>lagenarbeit<br />

Mathias Beck<br />

<strong>Directory</strong> <strong>Server</strong>, Installation <strong>und</strong> Gr<strong>und</strong>lagenarbeit<br />

Stefan Scheuermann<br />

<strong>Directory</strong> <strong>Server</strong>, Installation <strong>und</strong> Gr<strong>und</strong>lagenarbeit<br />

George Chetaguri<br />

Performance Untersuchung relationale Datenbank<br />

Oleg Diener<br />

Performance Untersuchung relationale Datenbank<br />

Daniel Heinemann<br />

Performance Untersuchung relationale Datenbank<br />

Gunar Porst<br />

Performance Untersuchung relationale Datenbank<br />

Seite 7


Verwendete Software<br />

Produktname Version Firma<br />

Apache 1314 Apache<br />

Argo UML 0.8 Uni California<br />

Communicator 4.77 Netscape<br />

cr2v 001109 Celinea<br />

Doczilla A3 Citec<br />

HTML-Kit 1.0 Chami.com<br />

Hybrick 0.86 Fujitsu<br />

IFS 8 Oracle<br />

Illustrator 9.0 Adobe<br />

InDelv 0.6 InDelv<br />

Internet Explorer 5.5 Microsoft<br />

Jade 1.2 Clark<br />

Lotus-XSL 1.0 IBM<br />

Oracle 8.16 Oracle<br />

PoetOss 6.1 Poet<br />

Rational Rose 98 Rational<br />

SMIL-Composer 1.0 Sausage Software<br />

svg2pdf 000320 digapp<br />

SVG Filter 1.0 Corel<br />

SVG Toolkit 000606 CSIRO<br />

SVG View 0.4 IBM<br />

SVG View 1.0 Adobe<br />

SVG View 2.0 beta Adobe<br />

Tamino 2.1 Software AG<br />

Together 9.82 Togethersoft<br />

Visual <strong>XML</strong> Tools<br />

IBM<br />

XDK<br />

Oracle<br />

Xeena 1.2 IBM<br />

XMetal 1.2 Softquad<br />

XMI Toolkit 1.15 IBM<br />

<strong>XML</strong> Authority 1.2 Extensibility<br />

<strong>XML</strong> Spy 3.0 c Icon Information Systems<br />

<strong>XML</strong> Style Wizard 1.0 Infoteria<br />

<strong>XML</strong> Writer 1.21 Wattle Software<br />

Seite 8


Produktname Version Firma<br />

XSL Editor 1.2 IBM<br />

XSL Tester 1.1 VB<strong>XML</strong><br />

XSL Trace 1.2 IBM<br />

XT 991105 Clark<br />

Verwendete Literatur<br />

• Implementing LDAP<br />

AutorIn: Mark Wilcox<br />

Verlag: Wrox Press<br />

ISBN: 1-861002-21-1<br />

• Understanding and Deploying LDAP <strong>Directory</strong> Services<br />

AutorIn: Timothy A. Howes (Ph.D.) , Mark C. Smith , Gordon S. Good<br />

Verlag: Macmillan Technical Publishing<br />

• <strong>XML</strong> Kompakt: Eine praktische Einführung<br />

AutorIn: Thomas Michel<br />

Verlag: Carl Hanser Verlag<br />

ISBN: 3-446-21302-3<br />

• <strong>XML</strong> in 21 Tagen<br />

AutorIn: Simon North , Paul Hermans<br />

Verlag: Carl Hanser Verlag<br />

ISBN: 3-8272-5687-9<br />

• <strong>XML</strong> in Action<br />

AutorIn: William J. Pardi<br />

Verlag: Microsoft Press<br />

ISBN: 3-86063-486-0<br />

• <strong>XML</strong> Handbuch<br />

AutorIn: Charles F. Goldfarb , Paul Prescod<br />

Verlag: Prentice Hall<br />

ISBN: 3-8272-9575-0<br />

• <strong>XML</strong> das Einsteigerseminar<br />

AutorIn: Michael Seeboerger-Weichselbaum<br />

Verlag: bhv Verlag<br />

ISBN: 3-8287-1018-2<br />

• <strong>XML</strong> in der Praxis<br />

AutorIn: Henning Behme , Stefan Mintert<br />

Seite 9


Verlag: Addison-Wesley<br />

ISBN: 3-8273-1330-9<br />

• Programmieren für das WWW<br />

AutorIn: Stephan Lamprecht<br />

Verlag: Carl Hanser Verlag<br />

ISBN: 3-446-19225-5<br />

• Teach Yourself <strong>XML</strong><br />

AutorIn: Simon North , Paul Hermans<br />

Verlag: Sams<br />

ISBN: 1-57521-396-6<br />

• HTML <strong>XML</strong> New Reference<br />

AutorIn: Oliver Pott<br />

Verlag: Markt <strong>und</strong> Technik<br />

ISBN: 3-8272-5617-8<br />

• <strong>XML</strong> für Dummies<br />

AutorIn: Ed Tittel , Norbert Mikula , Ramesh Chandak<br />

Verlag: MITP-Verlag<br />

ISBN: 3-8266-2860-8<br />

• The XSL Companion<br />

AutorIn: Neil Bradley<br />

Verlag: Addison-Wesley<br />

ISBN: 0-201-67487-4<br />

• XSLT Programmer's Reference<br />

AutorIn: Michael Kay<br />

Verlag: Wrox Press<br />

ISBN: 1-861003-12-9<br />

• XSL <strong>und</strong> XPath - verständlich <strong>und</strong> praxisnah<br />

AutorIn: Mike Bach<br />

Verlag: Addison-Wesley<br />

ISBN: 3-8273-1661-8<br />

• JDBC Internet-Datenbankanbindung mit Java<br />

AutorIn: Hans Dicken<br />

Verlag: Thomson Publishing<br />

ISBN: 3-8266-0343-5<br />

• Oracle 8 Die umfassende Referenz<br />

AutorIn: George Koch , Kevin Loney<br />

Verlag: Carl Hanser Verlag<br />

Seite 10


ISBN: 3-446-19460-6<br />

• Die <strong>XML</strong> Bibel<br />

AutorIn: Elliotte Rusty Harold<br />

Verlag: MITP-Verlag<br />

ISBN: 3-8266-0627-2<br />

• Java Das Gr<strong>und</strong>lagen Buch<br />

AutorIn: Mäurers , Baufeld , Friedrich , Müller , Wabnitz , Mühle<br />

Verlag: Data Becker<br />

ISBN: 3-8158-1384-0<br />

• Java als erste Programmiersprache, Java 2 Plattform<br />

AutorIn: Joachim Goll , Cornelia Weiß , Peter Rothländer<br />

Verlag: B. G. Teubner Stuttgart<br />

Ausstattung des EDV-Pools<br />

Das <strong>XML</strong>-Labor verfügt über einen NT-<strong>Server</strong> <strong>und</strong> vier NT-Arbeitsplatzrechner sowie<br />

einen Laserdrucker. Zur Datensicherung wird ein Bandlaufwerk genutzt.<br />

Darüberhinaus steht dem Labor ein kleiner quadratischer <strong>und</strong> leistungsstarker<br />

Heizlüfter zur Verfügung.<br />

5 Veröffentlichungen der Mitarbeiter<br />

Zahlreiche Veröffentlichungen sind im Verlaufe des Forschungsprojektes entstanden.<br />

Einen Teil dieser Dokumente können Sie hier herunterladen <strong>und</strong> einsehen. Bitte<br />

beachten Sie, daß das Copyright beim jeweiligen


• Christian Ey<br />

• Cosima Schmauch<br />

Storing <strong>XML</strong> Documents in <strong>Directory</strong> <strong>Server</strong>s<br />

Diplomarbeit:<br />

• Christian Ey<br />

Content-Management: Verfügbare Speichertechniken <strong>und</strong> der Einsatz von<br />

<strong>Directory</strong>-<strong>Server</strong>n<br />

Artikel: Buch "<strong>XML</strong> in der betrieblichen Praxis", dpunkt-Verlag, ISBN 3932588916<br />

• Cosima Schmauch<br />

• Christian Ey<br />

• Sissi Closs<br />

Content Management: Available Storage Technologies and the Use of <strong>Directory</strong><br />

<strong>Server</strong>s<br />

Artikel: Englische Übersetzung des deutschen Buchartikel<br />

• Cosima Schmauch<br />

• Christian Ey<br />

• Sissi Closs<br />

Managing <strong>XML</strong> Documents with <strong>Directory</strong> <strong>Server</strong>s<br />

Diplomarbeit:<br />

• Torsten Fellhauer<br />

Möglichkeiten der Nutzung von Scalable Vector Graphics (SVG) umgesetzt an<br />

einem Tutorial<br />

Diplomarbeit: Inhaltsverzeichnis <strong>und</strong> Ausschnitte<br />

• Iris Fibinger<br />

Seite 12

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!