XML + Directory Server - Fakultät für Informatik und ...
XML + Directory Server - Fakultät für Informatik und ...
XML + Directory Server - Fakultät für Informatik und ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>XML</strong> + <strong>Directory</strong> <strong>Server</strong><br />
unter der Leitung von<br />
Prof. Dr. rer. nat. Cosima Schmauch<br />
Prof. Dipl. Inform. Sissi Closs
1 Einleitung<br />
Dieses PDF-Dokument wurde von Torsten Fellhauer als Bestandteil seiner<br />
Diplomarbeit erstellt. Das Dokument basiert auf der Projektwebseite des<br />
Forschungsprojektes "<strong>XML</strong> + <strong>Directory</strong> <strong>Server</strong>". Mit Hilfe von XSL-Stylesheets wurde<br />
aus einer zentralen <strong>XML</strong>-Datei eine Formatting Objects-Datei erstellt, die durch den<br />
FO-Prozessor FOP des Apache <strong>XML</strong> Projekts zu einem PDF-Dokument<br />
umgewandelt wird.<br />
2 Kontaktinformationen<br />
Sie finden uns in der in der Fachhochschule Karlsruhe, Gebäude LI, Raum 139.<br />
Auf der Website der Fachhochschule Karlsruhe finden Sie einen Lageplan .<br />
Unsere Adresse lautet<br />
Software Labor der Fachhochschule Karlsruhe<br />
<strong>XML</strong> + <strong>Directory</strong> <strong>Server</strong><br />
Moltkestraße 30<br />
76133 Karlsruhe<br />
Tel: 0721/925-2316<br />
Fax: 0721/925-2361<br />
Ihre Ansprechpartner<br />
Prof. Dr. rer. nat. Cosima Schmauch<br />
Prof. Dipl. Inform. Sissi Closs<br />
Seite 2
3 Projektbeschreibung<br />
Auch Hochschulen kämpfen mit der Dokumentenflut, die sich vor allem aus ihren<br />
Präsentationen im World Wide Web <strong>und</strong> den nach wir vor zahlreichen<br />
Veröffentlichungen in Papierform ergeben. Waren früher nur ein<br />
Vorlesungsverzeichnis <strong>und</strong> die Prüfungsordnung erhältlich, wird heute jede Art von<br />
Information veröffentlicht, angefangen von der Telefonnummer des Dekans einer<br />
Fakultät oder eines Fachbereichs über das Vorlesungsangebot der Hochschule bis<br />
zu den laufenden Aktivitäten eines Forschungsprojekts. Je nach Medium werden<br />
verschiedene Sprachen <strong>und</strong> Formate verwendet, HTML, PS, TeX, oder RTF,<br />
MS-Word-Format <strong>und</strong> PDF.<br />
Die Dokumente haben häufig gleiche Inhalte bzw. Teilinhalte <strong>und</strong> auch ähnliche<br />
Strukturen, werden aber wegen der verschiedenen Formate mehrfach erstellt <strong>und</strong><br />
gepflegt. Es ist also naheliegend ihre Inhalte von den Formaten zu trennen <strong>und</strong> sie<br />
erst bei Bedarf wieder mit der Darstellungsinformation zusammen zu führen. <strong>XML</strong> mit<br />
seinen Ergänzungen zur Praesentation wie Cascading Style Sheets <strong>und</strong> eXtensible<br />
Style Sheet Language XSL bietet sich daher auch hier als Mittel zur Strukturierung<br />
an. Die einmal definierten Strukturelemente werden je nach Verwendungszweck <strong>und</strong><br />
Medium mit der angemessenen Layout-information verknuepft.<br />
<strong>XML</strong>-Dokumente sind Texte <strong>und</strong> werden in Textdateien gespeichert. Ihre Pflege<br />
bedarf also einiger Hilfsmittel, beispielsweise zur Erstellung wohlgeformter<br />
Dokumente, zur Validierung gegen eine Dokument-Typ-Definition, zur Konvertierung<br />
in andere Formate, zur Generierung von Dokumenten aus Datenbankinhalten <strong>und</strong><br />
zur Versionierung. Dazu gibt es inzwischen Werkzeuge wie <strong>XML</strong>-Editoren,<br />
Transformatoren <strong>und</strong> Zugriffs- <strong>und</strong> Versionskontrollsysteme.<br />
Damit noch nicht gelöst ist jedoch die Verwaltung der <strong>XML</strong>-Texte. Aufgaben wie<br />
red<strong>und</strong>anzfreie Ablage, Versionierung, Zugriffsschutz stehen auch hier an. Das sind<br />
Aufgaben, die klassischerweise mit einer Datenbank gelöst werden können. Der<br />
nächste Schritt besteht daher darin, beide Technologien zusammen zu bringen <strong>und</strong><br />
<strong>XML</strong>-Dokumente bzw. ihre einzelnen Elemente in einer Datenbank zu speichern. Aus<br />
Daten in der Datenbank sollen dann wieder neue Dokumente generiert werden<br />
können.<br />
Ein Beispiel verdeutlicht die Idee: aus detaillierten Beschreibungen der Fachbereiche<br />
einer Hochschule werden Kurzbeschreibungen für Pressemitteilungen oder eine<br />
Hochschulbroschüre generiert. Einleitungen <strong>und</strong> Zusammenfassungen von<br />
Seite 3
Studienarbeiten, Diplomarbeiten <strong>und</strong> Tagungsbeiträgen werden zum Abschlußbericht<br />
eines Forschungsprojekts zusammengestellt.<br />
Diese Beispiele zeigen die Anforderungen, die sich für an Dokumenten-Datenbanken<br />
stellen: die Struktur der Inhalte soll erhalten bleiben, damit Dokumententeile<br />
identifiziert, selektiert <strong>und</strong> mit anderen Dokumententeilen zu einem neuen Dokument<br />
kombiniert werden können.<br />
Es ist naheliegend, zunächst die derzeit meist verwendeten<br />
Datenbankmanagementsysteme wie relationale <strong>und</strong> objektorientierte auf ihre<br />
Brauchbarkeit im Zusammenhang mit <strong>XML</strong> zu prüfen. Weiterhin soll aber auch<br />
untersucht werden, wie gut sich <strong>Directory</strong> <strong>Server</strong>, die ursprünglich für Adressbücher<br />
entwickelt wurden, zur Speicherung von <strong>XML</strong>-Dokumenten eignen.<br />
Für den Verwaltungsbereich, wie er typischerweise an der Hochschule vorkommt,<br />
werden geeignete DTDs definiert, um eine effiziente Dokumentenverwaltung zu<br />
konzipieren. Zur Erprobung der gef<strong>und</strong>enen Lösungsansätze werden die Konzepte<br />
für die Daten <strong>und</strong> Dokumentationen eines Fachbereichs der Hochschule umgesetzt<br />
<strong>und</strong> später auf die Dokumentation der gesamten Hochschule übertragen <strong>und</strong> seine<br />
Anwendbarkeit in weiteren vergleichbaren Bereichen gezeigt werden.<br />
3.1 Themenbereiche<br />
Das Forschungsprojekt untersucht verschiedene in sich abgeschlossene<br />
Themenbereiche. Zur Erzielung eines Gesamtnutzens werden diese Bereiche über<br />
Schnittstellen miteinander verb<strong>und</strong>en. Unsere Kernthemen sind auf dieser Seite<br />
beschrieben.<br />
Speichern von <strong>XML</strong>-Dokumenten in <strong>Directory</strong> <strong>Server</strong>n<br />
Es gibt bis heute erst wenige sogenannte native <strong>XML</strong>-Datenbanken. Dagegen sind<br />
relationale <strong>und</strong> objektorientierte Datenbanken zur Datenhaltung sehr verbreitet. Auch<br />
<strong>Directory</strong> <strong>Server</strong> werden für organisatorische Unternehmensdaten immer häufiger<br />
eingesetzt. Wir untersuchen die Eignung dieser "herkömmlichen"<br />
Datenbanksysteme, speziell die der <strong>Directory</strong> <strong>Server</strong>, für die Speicherung von<br />
<strong>XML</strong>-Dokumenten <strong>und</strong> führen vergleichende Performance-Tests durch.<br />
Seite 4
DTD-Entwicklung für die Präsentation der Fachhochschule<br />
Wie jedes andere Unternehmen auch sieht sich die Fachhochschule mit dem<br />
Problem konfrontiert, dieselben Informationen, die sie in Web-Seiten <strong>und</strong> in<br />
unterschiedlicher Form in Broschüren, Faltblättern, Studienordnungen <strong>und</strong> anderen<br />
gedruckten Dokumenten veröffentlicht, möglichst red<strong>und</strong>anzfrei zu verwalten. Eine<br />
Trennung von Inhalt <strong>und</strong> Layout löst dieses Problem, erfordert jedoch eine<br />
Strukturierung des Inhalts mittels Konstrukten, an die Layout-Angaben geknüpft<br />
werden können. Wir verwenden für die Strukturierung <strong>XML</strong> (eXtensible<br />
Markup-Language) <strong>und</strong> für die Layouterstellung XSL (eXtensible Stylesheet<br />
Language). Die in den <strong>XML</strong>-Dokumenten verwendbaren Strukturelemente definieren<br />
wir in DTDs (Document Type Definition).<br />
<strong>XML</strong> <strong>und</strong> ergänzende Sprachen - Standardisierungen <strong>und</strong><br />
Entwicklungswerkzeuge<br />
Mit wachsender Verbreitung von <strong>XML</strong> steigen auch die Anforderungen an die<br />
Verwendungszwecke. Diesen begegnet das W3C (World Wide Web Consortium) mit<br />
der Standardisierung ergänzender Sprachkonzepte. Dies sind beispielsweise XLink,<br />
zur Verknüpfung von <strong>XML</strong>-Dokumenten, XPath zur Navigation in <strong>XML</strong>-Dokumenten,<br />
XPointer zur Festlegung von Ankern in einem <strong>XML</strong>-Dokument, XSL zur<br />
Layout-Beschreibung, XSLT zur Transformation von <strong>XML</strong>-Dokumenten, <strong>XML</strong> Query<br />
zur Formulierung von Anfragen an ein <strong>XML</strong>-Dokument <strong>und</strong> Scalable Vector Graphics<br />
(SVG) für die Erstellung vektororientierter 2-D-Graphiken. Für Ihre Anwendung<br />
empfiehlt es sich, Werkzeuge, wie <strong>XML</strong>- <strong>und</strong> XSL-Editoren, XSLT-Prozessoren <strong>und</strong><br />
<strong>XML</strong>-Datenbanken zu verwenden. Wir erstellen eine Übersicht zu diesen<br />
Enwicklungswerkzeugen.<br />
Seite 5
4 Projektorganisation<br />
Das vom September 1999 bis Februar 2001 laufende Projekt "<strong>XML</strong> + <strong>Directory</strong><br />
<strong>Server</strong>" wird durchgeführt vom Software Labor der Fachhochschule Karlsruhe.<br />
Unterstützung erhält das Projekt vom B<strong>und</strong>esministerium für Bildung <strong>und</strong> Forschung<br />
beteiligte Einrichtungen<br />
Fachbereich Sozialwissenschaften<br />
Fachbereich Wirtschaftsinformatik<br />
Institut für Innovation <strong>und</strong> Transfer<br />
Projektmitarbeiter<br />
Mitarbeiter<br />
Aufgaben<br />
Cosima Schmauch, Prof. Dr. rer. nat. Projektleitung<br />
Sissi Closs, Prof. Dipl. Inform. Projektleitung<br />
Reza Waladkhani, Dipl. Inform. (FH) Administration, PC-Pool, <strong>Directory</strong> <strong>Server</strong><br />
Christian Ey, Dipl. Inform. (FH) Storing <strong>XML</strong> Documents in <strong>Directory</strong> <strong>Server</strong>s<br />
Torsten Fellhauer, Dipl. Inform. (FH) Managing <strong>XML</strong> Documents with <strong>Directory</strong> <strong>Server</strong>s<br />
Iris Fibinger, Dipl. Ing. (FH)<br />
Scalable Vector Graphics<br />
Martin Rechner, Dipl. Ing. (FH) DTD, <strong>XML</strong>, XLink, XSLT-Stylesheets, Projektwebsite<br />
Erik Mueller<br />
Analyse des Tamino Information <strong>Server</strong>s der Software AG<br />
Dirk Wiltzsch<br />
DTD für die Fachhochschulverwaltung<br />
Philibert Odjo, Dipl. Inform. (FH) <strong>Directory</strong> <strong>Server</strong>, Installation <strong>und</strong> Gr<strong>und</strong>lagenarbeit<br />
Jochen Wünstel, Dipl. Inform. (FH) <strong>Directory</strong> <strong>Server</strong>, Installation <strong>und</strong> Gr<strong>und</strong>lagenarbeit<br />
Mathias Beck<br />
<strong>Directory</strong> <strong>Server</strong>, Installation <strong>und</strong> Gr<strong>und</strong>lagenarbeit<br />
Stefan Scheuermann<br />
<strong>Directory</strong> <strong>Server</strong>, Installation <strong>und</strong> Gr<strong>und</strong>lagenarbeit<br />
George Chetaguri<br />
Performance Untersuchung relationale Datenbank<br />
Oleg Diener<br />
Performance Untersuchung relationale Datenbank<br />
Daniel Heinemann<br />
Performance Untersuchung relationale Datenbank<br />
Gunar Porst<br />
Performance Untersuchung relationale Datenbank<br />
Seite 7
Verwendete Software<br />
Produktname Version Firma<br />
Apache 1314 Apache<br />
Argo UML 0.8 Uni California<br />
Communicator 4.77 Netscape<br />
cr2v 001109 Celinea<br />
Doczilla A3 Citec<br />
HTML-Kit 1.0 Chami.com<br />
Hybrick 0.86 Fujitsu<br />
IFS 8 Oracle<br />
Illustrator 9.0 Adobe<br />
InDelv 0.6 InDelv<br />
Internet Explorer 5.5 Microsoft<br />
Jade 1.2 Clark<br />
Lotus-XSL 1.0 IBM<br />
Oracle 8.16 Oracle<br />
PoetOss 6.1 Poet<br />
Rational Rose 98 Rational<br />
SMIL-Composer 1.0 Sausage Software<br />
svg2pdf 000320 digapp<br />
SVG Filter 1.0 Corel<br />
SVG Toolkit 000606 CSIRO<br />
SVG View 0.4 IBM<br />
SVG View 1.0 Adobe<br />
SVG View 2.0 beta Adobe<br />
Tamino 2.1 Software AG<br />
Together 9.82 Togethersoft<br />
Visual <strong>XML</strong> Tools<br />
IBM<br />
XDK<br />
Oracle<br />
Xeena 1.2 IBM<br />
XMetal 1.2 Softquad<br />
XMI Toolkit 1.15 IBM<br />
<strong>XML</strong> Authority 1.2 Extensibility<br />
<strong>XML</strong> Spy 3.0 c Icon Information Systems<br />
<strong>XML</strong> Style Wizard 1.0 Infoteria<br />
<strong>XML</strong> Writer 1.21 Wattle Software<br />
Seite 8
Produktname Version Firma<br />
XSL Editor 1.2 IBM<br />
XSL Tester 1.1 VB<strong>XML</strong><br />
XSL Trace 1.2 IBM<br />
XT 991105 Clark<br />
Verwendete Literatur<br />
• Implementing LDAP<br />
AutorIn: Mark Wilcox<br />
Verlag: Wrox Press<br />
ISBN: 1-861002-21-1<br />
• Understanding and Deploying LDAP <strong>Directory</strong> Services<br />
AutorIn: Timothy A. Howes (Ph.D.) , Mark C. Smith , Gordon S. Good<br />
Verlag: Macmillan Technical Publishing<br />
• <strong>XML</strong> Kompakt: Eine praktische Einführung<br />
AutorIn: Thomas Michel<br />
Verlag: Carl Hanser Verlag<br />
ISBN: 3-446-21302-3<br />
• <strong>XML</strong> in 21 Tagen<br />
AutorIn: Simon North , Paul Hermans<br />
Verlag: Carl Hanser Verlag<br />
ISBN: 3-8272-5687-9<br />
• <strong>XML</strong> in Action<br />
AutorIn: William J. Pardi<br />
Verlag: Microsoft Press<br />
ISBN: 3-86063-486-0<br />
• <strong>XML</strong> Handbuch<br />
AutorIn: Charles F. Goldfarb , Paul Prescod<br />
Verlag: Prentice Hall<br />
ISBN: 3-8272-9575-0<br />
• <strong>XML</strong> das Einsteigerseminar<br />
AutorIn: Michael Seeboerger-Weichselbaum<br />
Verlag: bhv Verlag<br />
ISBN: 3-8287-1018-2<br />
• <strong>XML</strong> in der Praxis<br />
AutorIn: Henning Behme , Stefan Mintert<br />
Seite 9
Verlag: Addison-Wesley<br />
ISBN: 3-8273-1330-9<br />
• Programmieren für das WWW<br />
AutorIn: Stephan Lamprecht<br />
Verlag: Carl Hanser Verlag<br />
ISBN: 3-446-19225-5<br />
• Teach Yourself <strong>XML</strong><br />
AutorIn: Simon North , Paul Hermans<br />
Verlag: Sams<br />
ISBN: 1-57521-396-6<br />
• HTML <strong>XML</strong> New Reference<br />
AutorIn: Oliver Pott<br />
Verlag: Markt <strong>und</strong> Technik<br />
ISBN: 3-8272-5617-8<br />
• <strong>XML</strong> für Dummies<br />
AutorIn: Ed Tittel , Norbert Mikula , Ramesh Chandak<br />
Verlag: MITP-Verlag<br />
ISBN: 3-8266-2860-8<br />
• The XSL Companion<br />
AutorIn: Neil Bradley<br />
Verlag: Addison-Wesley<br />
ISBN: 0-201-67487-4<br />
• XSLT Programmer's Reference<br />
AutorIn: Michael Kay<br />
Verlag: Wrox Press<br />
ISBN: 1-861003-12-9<br />
• XSL <strong>und</strong> XPath - verständlich <strong>und</strong> praxisnah<br />
AutorIn: Mike Bach<br />
Verlag: Addison-Wesley<br />
ISBN: 3-8273-1661-8<br />
• JDBC Internet-Datenbankanbindung mit Java<br />
AutorIn: Hans Dicken<br />
Verlag: Thomson Publishing<br />
ISBN: 3-8266-0343-5<br />
• Oracle 8 Die umfassende Referenz<br />
AutorIn: George Koch , Kevin Loney<br />
Verlag: Carl Hanser Verlag<br />
Seite 10
ISBN: 3-446-19460-6<br />
• Die <strong>XML</strong> Bibel<br />
AutorIn: Elliotte Rusty Harold<br />
Verlag: MITP-Verlag<br />
ISBN: 3-8266-0627-2<br />
• Java Das Gr<strong>und</strong>lagen Buch<br />
AutorIn: Mäurers , Baufeld , Friedrich , Müller , Wabnitz , Mühle<br />
Verlag: Data Becker<br />
ISBN: 3-8158-1384-0<br />
• Java als erste Programmiersprache, Java 2 Plattform<br />
AutorIn: Joachim Goll , Cornelia Weiß , Peter Rothländer<br />
Verlag: B. G. Teubner Stuttgart<br />
Ausstattung des EDV-Pools<br />
Das <strong>XML</strong>-Labor verfügt über einen NT-<strong>Server</strong> <strong>und</strong> vier NT-Arbeitsplatzrechner sowie<br />
einen Laserdrucker. Zur Datensicherung wird ein Bandlaufwerk genutzt.<br />
Darüberhinaus steht dem Labor ein kleiner quadratischer <strong>und</strong> leistungsstarker<br />
Heizlüfter zur Verfügung.<br />
5 Veröffentlichungen der Mitarbeiter<br />
Zahlreiche Veröffentlichungen sind im Verlaufe des Forschungsprojektes entstanden.<br />
Einen Teil dieser Dokumente können Sie hier herunterladen <strong>und</strong> einsehen. Bitte<br />
beachten Sie, daß das Copyright beim jeweiligen
• Christian Ey<br />
• Cosima Schmauch<br />
Storing <strong>XML</strong> Documents in <strong>Directory</strong> <strong>Server</strong>s<br />
Diplomarbeit:<br />
• Christian Ey<br />
Content-Management: Verfügbare Speichertechniken <strong>und</strong> der Einsatz von<br />
<strong>Directory</strong>-<strong>Server</strong>n<br />
Artikel: Buch "<strong>XML</strong> in der betrieblichen Praxis", dpunkt-Verlag, ISBN 3932588916<br />
• Cosima Schmauch<br />
• Christian Ey<br />
• Sissi Closs<br />
Content Management: Available Storage Technologies and the Use of <strong>Directory</strong><br />
<strong>Server</strong>s<br />
Artikel: Englische Übersetzung des deutschen Buchartikel<br />
• Cosima Schmauch<br />
• Christian Ey<br />
• Sissi Closs<br />
Managing <strong>XML</strong> Documents with <strong>Directory</strong> <strong>Server</strong>s<br />
Diplomarbeit:<br />
• Torsten Fellhauer<br />
Möglichkeiten der Nutzung von Scalable Vector Graphics (SVG) umgesetzt an<br />
einem Tutorial<br />
Diplomarbeit: Inhaltsverzeichnis <strong>und</strong> Ausschnitte<br />
• Iris Fibinger<br />
Seite 12