Studienanleitung - Userpage
Studienanleitung - Userpage
Studienanleitung - Userpage
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
BFO - Verteilte Datenbanksysteme<br />
- <strong>Studienanleitung</strong> -<br />
Hochschule Harz, Fachbereich Automatisierung und Informatik<br />
Prof. Dr.-Ing. habil. Andreas Schmietendorf<br />
Hochschule Harz<br />
Fachbereich Automatisierung und Informatik<br />
Friedrichstr. 57-59, D-38855 Wernigerode<br />
Web: http://userpage.fu-berlin.de/~schmiete/<br />
Email: schmiete@ivs.cs.uni-magdeburg.de<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 1
Inhaltsverzeichnis<br />
1. Motivation..........................................................................................................................3<br />
2. Zielstellungen.....................................................................................................................4<br />
3. Inhalte der Vorlesung.........................................................................................................4<br />
3.1 Ausgewählte Aspekte von Datenbanken..........................................................................4<br />
3.1.1 Klassische Zielstellungen von Datenbanken.............................................................4<br />
3.1.2 Architektur von Datenbankmanagementsystemen....................................................4<br />
3.1.3 Entwurf einer Datenbank...........................................................................................5<br />
3.1.4 Operationen Relationale Datenbankmanagementsysteme........................................5<br />
3.1.5 Der Transaktionsbegriff............................................................................................5<br />
3.2 Besonderheiten verteilter Datenbanksysteme..................................................................5<br />
3.2.1 Anforderungen an verteilte Datenbanken..................................................................5<br />
3.2.2 Architektur verteilter Datenbanken...........................................................................5<br />
3.2.3 Katalogverwaltung....................................................................................................5<br />
3.2.4 Entwurf verteilter Datenbanken................................................................................5<br />
3.2.5 Transaktionsverwaltung in verteilten DBS...............................................................6<br />
3.2.6 Verteilte Datenbanken mit Oracle.............................................................................6<br />
3.3 Föderierte Datenbanksysteme..........................................................................................6<br />
3.3.1 Zielstellungen föderierter Datenbanksysteme...........................................................6<br />
3.3.2 Referenzarchitekturen für föderierte Datenbanken...................................................6<br />
3.3.3 Föderierter Datenbankentwurf..................................................................................6<br />
3.3.4 Transaktionen in föderierten Datenbanken...............................................................6<br />
3.4 Serviceorientierte Informationsbereitstellung..................................................................7<br />
3.4.1 Überblick zu verteilten Informationssystemen.........................................................7<br />
3.4.2 Enterprise Application Integration............................................................................7<br />
3.4.3 Grundlegende Web Service Technologien................................................................7<br />
3.4.4 Verfügbare Web Services im Internet.......................................................................8<br />
3.5 Ausblick und Zusammenfassung.....................................................................................8<br />
4. Bewertungen, Übungen und Seminararbeit .......................................................................8<br />
4.1 Vorlesungsbegleitende Übungen......................................................................................8<br />
4.2 Seminararbeiten und Workshops.....................................................................................9<br />
4.3 Anforderungen an zu erstellende Protokolle....................................................................9<br />
5. Literaturhinweise..............................................................................................................10<br />
6. Informationen zum Dozenten...........................................................................................11<br />
Anlage – Plan der Vorlesungen/Übungen im WiSe 2013/14...................................................12<br />
Anlage – Seminarthemen im WiSe 2013/14............................................................................13<br />
Anlage – Ausgewählte Beispiele für Seminarthemen..............................................................14<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 2
1. Motivation<br />
Die Verteilung von Daten und Funktionen ist aus den heute verwendeten Informationssystemen<br />
nicht mehr wegzudenken und wird durch verschiedenste Technologien (insbesondere<br />
Middleware) unterstützt. Bereits in den 80-iger Jahren wurde der Aspekt einer Datenverteilung<br />
im Kontext entsprechender Datenbanksysteme aufgegriffen. Dem entsprechend verbirgt<br />
sich hinter dem Begriff eines verteilten Datenbanksystems sowohl in der Theorie, als auch in<br />
der Praxis eine große Vielfalt an möglichen konzeptionellen und implementierungsseitigen<br />
Ansätzen. Klassische verteilte Datenbanksysteme, die auf der Basis nur eines globalen konzeptionellen<br />
Schemas arbeiten, sind in der Praxis verhältnismäßig selten anzutreffen. Die Ursachen<br />
dafür liegen insbesondere in der Schwierigkeit begründet „ein einheitliches Unternehmensdatenmodell“<br />
zu etablieren und konstant zu halten. Aus diesem Grund hat sich vor<br />
ca. 20 Jahren der Begriff föderierter Datenbanksysteme etabliert. Föderierte Datenbanksysteme<br />
gehen von einer weitgehenden Autonomie der zu integrierenden (örtliche verteilten) Datenbanksysteme<br />
aus und berücksichtigen auch den Aspekt der Heterogenität (d.h. den Einsatz<br />
von Datenbankmanagementsystemen – DBMS unterschiedlicher Hersteller bzw. die Berücksichtigung<br />
unterschiedlicher Datenmodelle). Die Implementierung von Verteilungsmechanismen<br />
auf Ebene der Datenbanksysteme stellte sich jedoch im industriellen Umfeld als nicht<br />
optimal heraus. Zwar können Verteilungsanforderungen auf der Grundlage DBMS-eigener<br />
Techniken (wie z.B. Gateways, Datenbank-Links, Replikationsmechanismen) schnell und<br />
zumeist auch pragmatisch befriedigt werden, dennoch implizieren diese Lösungen häufig gravierende<br />
Nachteile. Diese liegen primär in den Aufwänden für die Wartung und Pflege, potentiellen<br />
Sicherheitsrisiken, der zumeist hohen Abhängigkeit von einem Hersteller, der Schwierigkeit<br />
auf neue Anforderungen schnell und abgegrenzt reagieren zu können und in der ungenügenden<br />
Berücksichtigung einer gewachsenen Systemlandschaft.<br />
In jüngster Zeit hat das Internet den Begriff der Verteilung massiv beeinflusst und klassische<br />
Techniken zur Entwicklung verteilter Systeme etwas in den Hintergrund gedrängt. Insbesondere<br />
die Entwicklung verteilter webbasierter Systeme steht heute im Vordergrund industrieller<br />
Aktivitäten und wird häufig unter dem Begriff des e-Business subsumiert. Webbasierte Integrationsansätze<br />
bieten die Möglichkeit heterogene Informationssysteme (inkl. der genutzten<br />
Datenbanken) im Rahmen gemeinsamer Aufgabenstellungen zu integrieren. Insbesondere die<br />
Technologie der Web Services profitiert von diesem Lösungsansatz, weshalb diese Technik<br />
sowohl im Kontext unternehmensinterner, als auch unternehmensübergreifender Integrationsansätze<br />
zunehmend zum Einsatz kommt.<br />
Dennoch müssen klassische Probleme einer Integration, wie z.B. die Abbildung bzw. der<br />
Umgang mit ähnlichen Entitäten und Beziehungen aus verschiedenen Informationssystemen,<br />
auch in höherwertigen Integrationsansätzen gelöst werden. Dafür kann auf die Erkenntnisse<br />
und Konzepte aus dem Umfeld der verteilten Datenbanksysteme zurückgegriffen werden. Bei<br />
höherwertigen Integrationsansätzen verschiebt sich allerdings der Schwerpunkt benötigten<br />
Tätigkeiten. So steht heute die Modellierung und semantische Interpretation entsprechender<br />
Geschäftsobjektmodelle (geschäftsrelevante Funktionen & Daten) und daraus resultierender<br />
Modelle für die Softwareentwicklung im Vordergrund einer Integration. Vereinfacht hat sich<br />
hingegen der Umgang mit den für die Integration benötigten technologischen Lösungsansätzen.<br />
Insbesondere im Kontext einer webbasierten Integration unterliegen diese einem herstellerunabhängigen<br />
Standardisierungsgremium. Sofern die Anbieter entsprechender Softwareprodukte,<br />
wie z.B. Oracle, IBM oder Microsoft, sich an diesen Standards zur Systemintegration<br />
orientieren, kann auf proprietäre Integrationsansätze nur eines DBMS-Anbieters verzichtet<br />
werden kann. Auf dieser Grundlage können die weiter oben genannten Nachteile verteilter<br />
Datenbanksysteme weitgehend vermieden werden.<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 3
2. Zielstellungen<br />
Die Vorlesung richtet sich an alle die einen grundlegenden Einblick zu verteilten Datenhaltungssystemen<br />
bekommen wollen. Dafür wird ausgehend von theoretischen und praktischen<br />
Ansätzen für verteilte Datenbanksysteme und deren implizierten Vor- und Nachteile, auf die<br />
zunehmende Bedeutung von höherwertigen Integrationsansätzen eingegangen. Höherwertige<br />
Integrationsansätze finden sich z.B. mit den modernen EAI-, SOA- oder auch bei Cloudbasierten<br />
Architekturen. Dennoch bleiben auch bei diesen Ansätzen grundlegende Probleme<br />
der semantischen Integration von Datenobjekten erhalten bzw. bedürfen entsprechender Lösungsansätze.<br />
Nach Besuch der Vorlesung sollten die folgenden Kenntnisse bei den Stundenten<br />
vorhanden sein:<br />
o Grundlegende Prinzipien und Lösungsansätze für verteilte Datenbanksysteme,<br />
o Überblick zu den angebotenen Verteilungsmechanismen eines RDBMS,<br />
o Lösungsansätze auf der Basis föderierter Datenbanksysteme,<br />
o Realisierung von Integrationsanforderungen in höheren Schichten,<br />
o Informationsbereitstellung in serviceorientierten Umgebungen,<br />
o Möglichkeiten der Transaktionsverarbeitung in verteilten Systemen,<br />
o Ausblick auf Entwicklungstendenzen<br />
Grundlage der Vorlesung sind die durch den Dozenten im praktischen Kontext gewonnenen<br />
Erfahrungen im Umgang mit industriell anstehenden Integrationsaufgaben. Durch die langjährige<br />
Verantwortung entsprechender Projekte innerhalb des Telekom-Konzerns können durch<br />
den Dozenten vielfältige Praxisproblemen im Rahmen der Vorlesung erörtert werden. Hinsichtlich<br />
der zur Vorlesung zu empfehlenden Literatur soll insbesondere auf [Rahm 1994],<br />
[Conrad 1997], [Knuth et al. 2003] und [Alonso et al. 2004] verwiesen werden.<br />
3. Inhalte der Vorlesung<br />
3.1 Ausgewählte Aspekte von Datenbanken<br />
Der 1. Teil der Vorlesung dient der Wiederholung ausgewählter Sachverhalte im Kontext von<br />
Datenbankmanagementsystemen. Ziel ist es für die folgenden Abschnitte eine gemeinsame<br />
Ausgangsbasis herzustellen, um so das Verständnis für verteilte Datenbanksysteme bzw. Systeme<br />
im Kontext einer verteilten Informationsbereitstellung zu ermöglichen.<br />
3.1.1 Klassische Zielstellungen von Datenbanken<br />
o Dauerhafte und redundanzarme Speicherung von Daten/Informationen<br />
o Gewährleistung von Integritätsbedingungen<br />
o Gewährleistung logischer und physischer Datenunabhängigkeit<br />
3.1.2 Architektur von Datenbankmanagementsystemen<br />
o Basisfunktionalitäten eines Datenbankmanagementsystems<br />
o 3-Ebenen Architektur nach ANSI-SPARC<br />
o Schichten eines DBMS<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 4
3.1.3 Entwurf einer Datenbank<br />
o Phasen des Datenbankentwurfs<br />
o ER-Modellierung und Normalisierung<br />
o Schlüsselkonzept (Primär- und Fremdschlüssel)<br />
3.1.4 Operationen Relationale Datenbankmanagementsysteme<br />
o Selektion (Auswahl von Zeilen/Tupeln)<br />
o Projektion (Auswahl von Spalten)<br />
o Verbundoperation (Join) über zwei Relationen<br />
3.1.5 Der Transaktionsbegriff<br />
o A – Atomicity (Das „alles“ oder „nichts“ Prinzip)<br />
o C – Consistency (Konsistenter Zustand der Datenbank)<br />
o I – Isolation (Isolierter Ablauf paralleler Transaktionen)<br />
o D – Durability (Dauerhafte Speicherung von Transaktionsergebnissen)<br />
3.2 Besonderheiten verteilter Datenbanksysteme<br />
Im Rahmen des 2. Teils der Vorlesung wollen wir auf den klassischen Ansatz verteilter Datenbanksysteme<br />
eingehen. Neben der Vorstellung ausgewählter Aufgabenstellungen im Kontext<br />
des Einsatzes solcher Systeme, soll im abschließenden Teil auch die aktuell vorhandene<br />
Unterstützung für eine verteilte Verarbeitung innerhalb des Datenbankmanagementsystems<br />
Oracle vorgestellt werden.<br />
3.2.1 Anforderungen an verteilte Datenbanken<br />
o Übersicht und Einführung<br />
o 12 Anforderungen für verteilte Datenbanken<br />
o Leistungstransparenz und grobe Definition<br />
3.2.2 Architektur verteilter Datenbanken<br />
o 4-Ebenen Architektur<br />
o Globales konzeptuelles- und Verteilungs-Schema<br />
o Lokales konzeptuelles- und lokales internes Schema<br />
3.2.3 Katalogverwaltung<br />
o Aufgaben der Katalogverwaltung<br />
o Lokaler vs. globaler Katalog<br />
o Arten der Katalogverwaltung und Bewertung<br />
3.2.4 Entwurf verteilter Datenbanken<br />
o Aufgaben beim Entwurf eines verteilten DBS<br />
o Fragmentierung und Allokation<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 5
o Arten der Fragmentierung (Horizontal, Vertikal, Gemischt)<br />
3.2.5 Transaktionsverwaltung in verteilten DBS<br />
o Struktur verteilter Transaktionen<br />
o Sicherstellung der Transaktionsbedingungen<br />
3.2.6 Verteilte Datenbanken mit Oracle<br />
o Datenbank- und Netzwerksunterstützung für verteilte Systeme<br />
o Verwendung von Oracle Datenbank-Links<br />
3.3 Föderierte Datenbanksysteme<br />
In der Praxis ist es schwer den klassischen Ansatz (siehe Abschnitt 3.2) für ein verteiltes Datenbanksystem<br />
auch tatsächlich umzusetzen. Hier gilt es zumeist langjährig bestehende Systeme<br />
zu integrieren. Dabei ergibt sich häufig das Problem der Heterogenität, d.h. weder die<br />
eingesetzten Netzwerk- und Betriebssysteme, noch die verwendeten Datenbankmanagementsysteme<br />
sind von einem Hersteller. Föderierte Datenbanksysteme erlauben die Integration<br />
unterschiedlicher Systeme, die dabei auftretenden Besonderheiten sollen im 3. Teil der Vorlesung<br />
besprochen werden.<br />
3.3.1 Zielstellungen föderierter Datenbanksysteme<br />
o Einsatzgebiete und Anwendungsszenarien<br />
o Integration existierender Datenbestände<br />
o Migration – schrittweise Ablösung von Altsystemen<br />
3.3.2 Referenzarchitekturen für föderierte Datenbanken<br />
o Import-/Export-Schema-Architektur<br />
o Multidatenbank-Architektur<br />
o 5-Ebenen-Schema-Architektur<br />
3.3.3 Föderierter Datenbankentwurf<br />
o Erhaltung der Autonomie bestehender Datenbestände<br />
o Schematransformation und Schemaintegration<br />
o Integrationsstrategien & Integrationsprozess<br />
o Ausgewählte Integrationskonflikte<br />
3.3.4 Transaktionen in föderierten Datenbanken<br />
o Heterogene Transaktionsverwaltung in föderierten Systemen<br />
o Geschachtelte Transaktionen in föderierten Systemen<br />
Wenngleich der Ansatz eines föderierten Datenbanksystems nicht mit einem industriellen<br />
Produkt gleichgesetzt werden kann, bietet sich mit den dabei herausgearbeiteten Konzepten<br />
eine ideale Grundlage für höherwertige Integrationsansätze. Dem entsprechend stellen diese<br />
eine fundierte Basis für z.B. webbasierte Systemintegrationen dar. Im Kontext dieses Abschnittes<br />
sei insbesondere auf die umfangreichen konzeptionellen Darstellungen in [Conrad<br />
1997] verwiesen.<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 6
3.4 Serviceorientierte Informationsbereitstellung<br />
Moderne Lösungsansätze verlagern die Integration von vorhandenen Systemen und den dahinter<br />
liegenden Datenbeständen in höher gelagerte Schichten der Anwendung. In diesem<br />
Zusammenhang wird häufig von entsprechender Middleware gesprochen. Im Rahmen des 4.<br />
Teils (Bestandteil des folgenden Semesters) der Vorlesung wollen wir auf derartige Ansätze<br />
eingehen.<br />
3.4.1 Überblick zu verteilten Informationssystemen<br />
o Potentielle Architekturansätze<br />
o Kommunikationsbeziehungen (synchron vs. asynchron)<br />
o Middleware (RPC, CORBA und MOM)<br />
o Grundlegende Web-Technologien (Protokolle und Generationen)<br />
o Application Server als Integrationsplattformen.<br />
3.4.2 Enterprise Application Integration<br />
o Historische Entwicklung und Zielstellungen von EAI<br />
o Schichtenmodell der Applikationsintegration<br />
o Integrationslevel<br />
o Datenaustausch mit XML<br />
o Dienste von EAI-Lösungen<br />
o Produkte im EAI-Umfeld<br />
3.4.3 Grundlegende Web Service Technologien<br />
o XML als Datenbeschreibungssprache<br />
o Schemadefinition als Grammatik von XML-Dokumenten<br />
o XML Frameworks (ebXML, XML/EDI)<br />
o XML Vokabulare (cXML, xCBL)<br />
o SOAP – Simple Object Access Protocol<br />
o Aufbau und Struktur<br />
o RPC- und DOC-orientierte Arbeitsweise<br />
o WSDL – Spezifikation von Web Services<br />
o Struktur und Elemente eines WSDL-Interfaces<br />
o Implikationen des WSDL-Modells<br />
o WSDL-Programmierungstechniken<br />
o Weitere Ansätze bzw. Architekturvorschläge<br />
o REST Architekturstil<br />
o JSON-Services<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 7
3.4.4 Verfügbare Web Services im Internet<br />
o Überblick zu verfügbaren Web Service Verzeichnissen<br />
o Auffinden von Web Services<br />
o Art der derzeit im Internet angebotenen Web Services<br />
o Empirische Betrachtungen zu verfügbaren Web Services<br />
o Identifizierung über die Basistechnologien hinausgehender Ansätze.<br />
3.5 Ausblick und Zusammenfassung<br />
o Datenbanken zur Verwaltung von XML-Dokumenten<br />
o XML-Anfragesprachen (XQuery und XPath)<br />
o Feedback zur Vorlesung<br />
4. Bewertungen, Übungen und Seminararbeit<br />
4.1 Vorlesungsbegleitende Übungen<br />
Im Rahmen der Vorlesung werden teamorientierten Übungen bearbeitet. Diese sind durch<br />
jeweils 2 bis 4 Studenten im Team umzusetzen. Bei den Übungen handelt es sich um grundlegende<br />
Problemstellungen verteilter Datenbanksysteme bzw. die modelltechnische Erfassung<br />
von Integrationsaspekten. Die Verwendung von Referenzdatenmodellen stellt darüber hinaus<br />
einen möglichen Ansatz zur Standardisierung einer unternehmensinternen, aber auch unternehmensübergreifenden<br />
Datenmodellierung dar. Im Einzelnen handelt es sich bei den Übungen<br />
um die folgenden Themen:<br />
1. Anforderungen an verteilten Datenhaltungssysteme (Brainstorming/Metaplan)<br />
2. Mögliche Verteilungsmechanismen/-Techniken in konkreten RDBMS-Produkten<br />
3. Erstellung eines föderierten Datenbankschema (zusicherungsbasierte Integration)<br />
4. Verwendung von Referenzdatenmodellen in serviceorientierten Umgebungen<br />
Auf der Grundlage zweier bewerteter Übungen wird eine Vornote ermittelt, die mit 50% in<br />
die Gesamtbewertung des Semesters eingeht. Die Bewertung der Übungen setzt sich aus den<br />
Protokollen und jeweils einem Kurzvortrag (10 min + 5 min Fragen) zusammen. Die Bewertung<br />
des Kurzvortrags erfolgt anhand der folgenden Kriterien:<br />
- Inhalt – Aufgabentreue und ggf. benötigte Abgrenzungen<br />
- Struktur – Gewährleistung eines roten Faden durch die Themenstellung<br />
- Kritik – Kritische Würdigung der bearbeiteten Themen<br />
- Präsentations-Stil – Köpersprache, Begeisterung und Medieneinsatz<br />
- Zeittreue – Einhaltung des vorgegebenen Zeitlimits<br />
- Form – grafische Aufbereitung der behandelten Themen<br />
- Fragen – Umgang mit Fragen während bzw. nach der Präsentation<br />
Auch wenn nur 2 Übungen in die Bewertung eingehen setzt der erfolgreiche Abschluss die<br />
Durchführung aller 4 Übungen voraus!<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 8
4.2 Seminararbeiten und Workshops<br />
Die Inhalte der Seminararbeiten sind mit dem Dozenten ca. 1 Monat vor dem Ende des Semesters<br />
abzusprechen. Dabei kann sowohl ein eigener Themenvorschlag, als auch ein durch<br />
den Dozenten bereitgestelltes Thema (ausgewählte Beispiele siehe Anlage innerhalb dieser<br />
<strong>Studienanleitung</strong>) bearbeitet werden. Sofern die Seminararbeit mit mindestens genügend bestanden<br />
wird, setzt sich die Bewertung des Fachs zu 50% aus den Übungsergebnissen und zu<br />
50% aus der Seminararbeit (Referat/Beleg) zusammen. Die Bewertung des Referats erfolgt<br />
unter Verwendung der bereits bei den Übungsvorträgen verwendeten Bewertungskriterien.<br />
Aus inhaltlicher Sicht bedarf es, unabhängig von der bearbeiteten Themenstellung, der Berücksichtigung<br />
(Analyse/Bewertung) der Dimensionen eines verteilten Datenbanksystems in<br />
Bezug auf „Verteilung“, „Heterogenität“ und „Autonomie“.<br />
Grundsätzlich sollte die Seminararbeit eine wissenschaftliche Herangehensweise aufzeigen<br />
und den folgenden strukturellen Aufbau besitzen. Der Umfang sollte etwa 10 bis 15 Seiten<br />
betragen, ggf. können Anlagen für Untersuchungsergebnisse verwendet werden.<br />
- Zielstellung,<br />
- Grundlagen zum Thema,<br />
- durchgeführte Analysen,<br />
- ggf. erarbeitete konzeptionelle Aspekte,<br />
- ggf. realisierte prototypische Implementierungen,<br />
- Zusammenfassung & Ausblick<br />
- Quellenverzeichnis<br />
Die Abgabe der Arbeit erfolgt in elektronische Form (Präsentation und Seminararbeit) bis<br />
zum 19. Februar 2014 (strikt einzuhalten) über die folgende email-Adresse an der Universität<br />
Magdeburg: schmiete@ivs.cs.uni-magdeburg.de<br />
4.3 Anforderungen an zu erstellende Protokolle<br />
Grundsätzlich sollten alle anzufertigenden Protokolle die folgende Struktur berücksichtigen:<br />
- Allgemeine Angaben<br />
a. Versuch, Beteiligte Studenten, Datum<br />
b. Rahmenbedingungen (Software, Hardware, …)<br />
c. Methodisches Vorgehen zu Bearbeitung<br />
- Aufgaben des Laborversuchs<br />
a. Aufgabenstellung<br />
b. Textliche Ausführungen zu den Lösungen<br />
c. Verwendung von Grafiken und Screenshots<br />
- Zusammenfassung (Bewertung der erreichten Ergebnisse)<br />
- Genutzte Quellen (z.B. Literatur, Internet, …)<br />
Die Abgabe der Protokolle erfolgt in elektronische Form (Präsentationen und Protokolle) bis<br />
zum 19. Februar 2014 (strikt einzuhalten) über die folgende email-Adresse an der Universität<br />
Magdeburg: schmiete@ivs.cs.uni-magdeburg.de<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 9
5. Literaturhinweise<br />
Die im Folgenden kurz vorgestellten Literaturhinweise bieten eine Übersicht zu weiterführenden<br />
Information, zu den im Kontext der Vorlesung vermittelten Themengebieten. Die dabei<br />
gewählte Reihenfolge widerspiegelt die Stärke des Bezugs zur Vorlesung, d.h. auf die Inhalte<br />
der letzt genannten Bücher wird im Rahmen der Vorlesung nur geringer Bezug genommen.<br />
[Rahm 1994] Rahm, E.: Mehrrechner-Datenbanksysteme – Grundlagen der verteilten und<br />
parallelen Datenverarbeitung, Addison-Wesley, Bonn, 1994<br />
[Conrad 1997] Conrad, S.: Föderierte Datenbanksysteme – Konzepte der Datenintegration,<br />
Springer-Verlag, Berlin, 1997<br />
[Dostal 2005] Dostal, W.; Jeckle, M.; Melzer, I.; Zengler, B.: Service-orientierte Architekturen<br />
mit Web Services (Konzepte – Standards – Praxis), Spektrum Akademischer Verlag,<br />
München, 2005<br />
[Knuth et al. 2003] Knuth, M. et al.: Web Services – Einführung und Übersicht, Software<br />
Support Verlag, Frankfurt, 2003<br />
[Alonso et al. 2004] Alonso, G.; Casati, F.; Kuno, H.; Machiraju, V.: Web Services, Springer-<br />
Verlag, Berlin 2004<br />
[Seemann 2003] Seemann, M.: Native XML-Datenbanken im Praxiseinsatz, Software Support<br />
Verlag, Frankfurt, 2003<br />
[Kemper/Eickler] Kemper, A.; Eickler, A: Datenbanksysteme – Eine Einführung, Oldenbourg-Verlag,<br />
München Wien, 2004<br />
[Sneed/Sneed] Sneed, H.; Sneed, S. H.: Web-basierte Systemintegration, Vieweg-Verlag,<br />
Braunschweig/Wiesbaden, 2003<br />
[Chappell/Jewell] Chappell, D. A.; Jewell, T.: Java Web Services, O`Reilly-Verlag, Sebastopol/CA,<br />
2002<br />
[Chappell 2002] Chappell, D. A.: Enterprise Service Bus – Theorie in Practice, O`Reilly-<br />
Verlag, Sebastopol/CA, 2002<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 10
6. Informationen zum Dozenten<br />
Andreas Schmietendorf arbeitet als Professor für Wirtschaftsinformatik (Systementwicklung)<br />
an der Hochschule für Wirtschaft und Recht Berlin (Berlin School of Economics and Law).<br />
Daneben hält er eine Privatdozentur für Software-Engineering an der Otto-von-Guericke-<br />
Universität Magdeburg. Seine berufliche und wissenschaftliche Entwicklung im Bereich der<br />
Informationsverarbeitung ist eng mit seiner Tätigkeit bei der Deutschen Telekom AG verbunden,<br />
bei der er mehr als zwölf Jahre beschäftigt war. Bis zu seinem Ruf auf eine Datenbankprofessur<br />
an die Hochschule Harz im Jahr 2004 arbeitete er als Abteilungsleiter und Chefarchitekt<br />
beim Entwicklungszentrum Berlin innerhalb des Telekom-Konzerns.<br />
Nach wie vor berät er Industrieunternehmen bzw. die öffentliche Verwaltung zu ausgewählten<br />
Problemstellungen wie z.B. dem Management komplexer Entwicklungs- und Integrationsprojekte<br />
oder auch zu Fragen des Geschäftsprozessmanagements. Ebenso ist er Vizepräsident der<br />
Central Europe Computer Measurement Group (ceCMG), Beirat des Arbeitskreises Software-<br />
Qualität und -Fortbildung e.V. (ASQF), Partner der Deutschsprachigen Anwendergruppe für<br />
Software-Metrik und Aufwandschätzung (DASMA). Darüber hinaus rief er im Jahr 2006 die<br />
BSOA-Initiative ins Leben, in deren Rahmen er den jährlich stattfindenden Workshop „Bewertungsaspekte<br />
service- und cloudbasierter Architekturen“ durchführt.<br />
Ausgewählte Referenzprojekte der letzten Jahre:<br />
- Durchführung von Qualitäts- und Kostenbewertungen im Rahmen des Integrationsprojektes<br />
„DualPhone“. (Partner: T-Systems Berlin) - 2006<br />
- Einsatz moderner Integrationsarchitekturen im Bereich der öffentlichen Verwaltung<br />
und bei Bundesbehörden (Partner: IBM Deutschland GmbH) - 2007<br />
- Beratungsleistungen im Projekt „SOA-E2E Management“, speziell SOA-Vorgehen<br />
und SOA-Bewertungsaspekte (Partner: T-Systems Berlin) - 2007<br />
- Vorgehensweise und Konzeption einer flächendeckenden Geschäftsprozessanalyse bei<br />
einer verteilten Organisation (Partner: Bundesarchiv) – 2008<br />
- Vorbereitung und Durchführung von Spezialseminaren zu den Möglichkeiten von Referenzmodellen,<br />
konkret BPMN, ITIL und SID (Partner: T-Systems Berlin) - 2008<br />
- Gutachten zur Auswahl eines Modellierungs- und Simulationswerkzeugs im Kontext<br />
der Anforderungen des Projektes BIS (Partner: Deutsche Telekom AG) - 2009<br />
- Bewertung des Architekturkonzepts innerhalb des Innovationsprojektes zur Entwicklung<br />
einer Prozess- und Service-Plattform (Partner: T-Systems Berlin) – 2009<br />
- Redesigns der Datenbankzugriffsschicht einer existierenden Applikation unter Zuhilfenahme<br />
eines Object-Relational-Mappings (Partner: T-Systems Berlin) – 2012<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 11
Anlage – Plan der Vorlesungen/Übungen im WiSe 2013/14<br />
Raum: 5.301, Donnerstag ab 09:45<br />
Bachelor - Wirtschaftsinformatik (5. Semester)<br />
Vorlesung Termin Vorlesung Übung<br />
01 12.09.2013 Einführung zur Vorlesung und Informationen<br />
zu Belegarbeiten<br />
02 26.09.2013 Ausgewählte Aspekte von Datenbanken<br />
(Grenzen nicht verteilter Systeme)<br />
Übung 1: Metaplantechnik<br />
03 10.10.2013 Besonderheiten verteilter Datenbanksysteme<br />
04 17.10.2013 Besonderheiten verteilter Datenbanksysteme<br />
Übung: 2 Verteilungsmechanismen<br />
von DBMS<br />
05 24.10.2013 Besonderheiten verteilter Datenbanksysteme<br />
06 20.11.2013 Besonderheiten verteilter Datenbanksysteme<br />
07 21.11.2013 Föderierte Datenbanksysteme Übung 3: Föderierter<br />
DB-Entwurf<br />
08 28.11.2013 Föderierte Datenbanksysteme<br />
09 05.12.2013 Föderierte Datenbanksysteme Übung 4: Referenzdatenmodelle<br />
10 12.12.2013 Entwicklungstendenzen<br />
11 19.12.2013 Auswertung Referenzdatenmodelle<br />
12/13 09.01.2014 Prüfungen durchgeführt im Block Seminarvorträge<br />
14/15 16.01.2014 Prüfungen durchgeführt im Block Seminarvorträge<br />
Die terminliche Zuordnung der dargestellten Themen stellt nur eine grobe Orientierung dar,<br />
hier kann es je nach Lernfortschritt noch zu geringfügigen Verschiebungen kommen. Zur<br />
Vorbereitung und Abstimmung kann es darüber hinaus zu zusätzlichen Terminen innerhalb<br />
des Dezembers kommen.<br />
Die Termine für die Seminarvorträge sind offizielle Prüfungen der HS Harz. Auf der Grundlage<br />
dieser Seminarvorträge (ca. 20 min) und einer entsprechenden Belegarbeit bzw. Entwurfsarbeit<br />
(10-15 Seiten) wird das Fach durch jeden einzelnen Studenten abgeschlossen.<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 12
Anlage – Seminarthemen im WiSe 2013/14<br />
Name Thema Präsentations-<br />
Termin<br />
N.N.<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 13
Anlage – Ausgewählte Beispiele für Seminarthemen<br />
Die vorgestellten Themen für Seminararbeiten geben eine Anregung zu potentiell lösbaren<br />
Aufgabenstellungen. Die dabei angegebenen Stichpunkte dienen der groben Orientierung inhaltlich<br />
zu bearbeitender Themengebiete, die Erarbeitung einer korrespondierenden Gliederung<br />
obliegt allerdings dem konkreten Bearbeiter. Dabei ist sowohl die Einordnung, aber auch<br />
die Abgrenzung zu nicht behandelten Themen zu berücksichtigen. In diesem Zusammenhang<br />
sollten die aufgezeigten Stichpunkte konkretisiert werden. Die Ausarbeitung sollte sich an der<br />
unter Abschnitt 4 vorgestellten Vorgehensweise orientieren.<br />
1. Optimierung von DB-Anfragen in verteilten Datenbanksystemen<br />
- Problemstellung der Anfrageoptimierung bei verteilten DBS<br />
- Umgang mit redundanten Daten und Inkonsistenzen<br />
- Möglichkeiten des Query-Optimizers<br />
2. Analyse des Transparenzbegriffes im Rahmen einer SOA<br />
- Darstellung möglicher Sichten<br />
- Transparenz im Kontext abzubildender Geschäftsprozesse<br />
- Transparenz aus Sicht der Entwicklung & Wirkbetrieb<br />
3. Aspekte der Normalisierung bei verteilten Datenbanksystemen<br />
- Zielstellungen der klassischen Normalisierung (1. NF, 2. NF, 3. NF)<br />
- Abbildung eines relationalen DB-Entwurfs auf ein verteiltes DBS<br />
- Denormalisierung (Zielstellungen und Umgang mit Redundanzen)<br />
4. Notationen für die Modellierung verteilter Datenbanksysteme<br />
- Klärung des Begriffes einer Notation<br />
- Analyse verfügbarer Notationen (ER-Modellierung, UML, …)<br />
- Besonderheiten der Modellierung verteilter Datenbanksysteme<br />
5. Durchgängigkeit von Funktions- und Datenmodellierung<br />
- Modellierung im Lebenszyklus eines Softwareproduktes<br />
- Analyse verfügbarer Notationen (BPMN, EPK, BPEL, ER-Modellierung, UML, …)<br />
- Business-Datenmodell, Business-Objektmodell, Business-Servicemodell<br />
6. Partitionierung von Daten mit Hilfe einer Verteilungs- und Konfigurationsanalyse<br />
- Analyse genutzter Daten & Nutzerprofile<br />
- Kriterien zur Verteilung von Katalogdaten in einem VDBS<br />
- Monitoring der tatsächlichen Datennutzung<br />
7. Fragmentierungs- und Allokationstransparenz<br />
- Gebotene Werkzeugunterstützung (Verteilungsentwurf)<br />
- Gewährleistung der Redundanzfreiheit<br />
- Abbildung von Abfragen über verteilten Relationen<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 14
8. Transaktionsbehandlung in Web Service-basierten Systemen<br />
- Überblick zu Web Service-basierten Integrationslösungen<br />
- Transaktionsprotokolle für verteilte Systeme<br />
- WS Coordination & WS Transaction<br />
9. Datenbankschnittstellen im Kontext von VDBS<br />
- Überblick zu existierenden Schnittstellen (JDBC, ODBC, XA, XA+, …)<br />
- Persistenzschichten – Mapping zwischen Anwendung & Datenbank<br />
- Realisierung von verteilten DBS<br />
10. XML-Datenbanken und verteilte DBS<br />
- Überblick zu XML-basierten DBS<br />
- Abbildung von Verteilungseigenschaften<br />
- Interoperabilität zu anderen DBS (z.B. ORDBMS, OODBMS)<br />
11. Einsatz von Middlewaretechnologien im Kontext VDBS<br />
- Begriff der Middleware klären (Ziele, Gegenstand, Einsatzbereiche, …)<br />
- Beispiele konkreter Middlewareansätze (DCE, CORBA, RMI, …)<br />
- Einsatzmöglichkeiten bei der Realisierung föderierter DBS<br />
12. Verteilte DBS im Bereich von Multimediaanwendungen<br />
- Besonderheiten multimedialer Daten (vgl. zu Daten eines klass. RDBMS)<br />
- Industrielle & akademische Beispiele für VDBS<br />
- Integrationsaspekte zu anderen DBS (Schwerpunkt: RDBMS)<br />
13. Möglichkeiten zur Serialisierung von Objekten unter Java<br />
- Begriff der Serialisierung einordnen<br />
- Klassischer und fortgeschrittene Serialisierungsmechanismen unter Java<br />
- Serialisierung im Kontext eines verteilten DBS<br />
14. Empirische Analyse zu verfügbaren Referenzdatenmodellen<br />
- Zielstellung von Referenzdatenmodellen<br />
- Verfügbare Ansätze in verschiedenen Branchen<br />
- Beispielhafte Darstellung des Einsatzes über entsprechende Tools<br />
15. Schemaintegration und Schemamigration<br />
- Ziele der Schemaintegration und Schemaintegration<br />
- Analyse verfügbarer Integrationsmethoden<br />
- Darstellung eines konkreten Beispiels, wie z.B. XML-basierte Schemaintegration<br />
16. NoSQL-Datenbanken (not only SQL) im Internet<br />
- Eigenschaften von NoSQL-Darenbanken<br />
- Verteilte Datenverarbeitung im Kontext des CAP-Theorems<br />
- Einsatzgebiete für NoSQL-Datenbanken<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 15
17. Spaltenorientierte Datenbanksysteme<br />
- Besonderheiten spaltenorientierter Datenbanken (Bezug zu OLAP)<br />
- Spaltenorientierte Anfrage-Ausführung<br />
- Beispiele für konkrete Systeme<br />
18. Big Data Applikationen<br />
- Historie zur Entstehung und Identifikation möglicher Einsatzszenarien<br />
- Open-Source-Frameworks „Hadoop“ und NoSQL-Datenbank „HBase“<br />
- Skalierbarkeit und Performance<br />
Verteilte DBS I - Vorlesung 22.11.2013<br />
HS Harz WiSe13, A. Schmietendorf Seite 16