30.01.2014 Aufrufe

Studienanleitung - Userpage

Studienanleitung - Userpage

Studienanleitung - Userpage

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

BFO - Verteilte Datenbanksysteme<br />

- <strong>Studienanleitung</strong> -<br />

Hochschule Harz, Fachbereich Automatisierung und Informatik<br />

Prof. Dr.-Ing. habil. Andreas Schmietendorf<br />

Hochschule Harz<br />

Fachbereich Automatisierung und Informatik<br />

Friedrichstr. 57-59, D-38855 Wernigerode<br />

Web: http://userpage.fu-berlin.de/~schmiete/<br />

Email: schmiete@ivs.cs.uni-magdeburg.de<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 1


Inhaltsverzeichnis<br />

1. Motivation..........................................................................................................................3<br />

2. Zielstellungen.....................................................................................................................4<br />

3. Inhalte der Vorlesung.........................................................................................................4<br />

3.1 Ausgewählte Aspekte von Datenbanken..........................................................................4<br />

3.1.1 Klassische Zielstellungen von Datenbanken.............................................................4<br />

3.1.2 Architektur von Datenbankmanagementsystemen....................................................4<br />

3.1.3 Entwurf einer Datenbank...........................................................................................5<br />

3.1.4 Operationen Relationale Datenbankmanagementsysteme........................................5<br />

3.1.5 Der Transaktionsbegriff............................................................................................5<br />

3.2 Besonderheiten verteilter Datenbanksysteme..................................................................5<br />

3.2.1 Anforderungen an verteilte Datenbanken..................................................................5<br />

3.2.2 Architektur verteilter Datenbanken...........................................................................5<br />

3.2.3 Katalogverwaltung....................................................................................................5<br />

3.2.4 Entwurf verteilter Datenbanken................................................................................5<br />

3.2.5 Transaktionsverwaltung in verteilten DBS...............................................................6<br />

3.2.6 Verteilte Datenbanken mit Oracle.............................................................................6<br />

3.3 Föderierte Datenbanksysteme..........................................................................................6<br />

3.3.1 Zielstellungen föderierter Datenbanksysteme...........................................................6<br />

3.3.2 Referenzarchitekturen für föderierte Datenbanken...................................................6<br />

3.3.3 Föderierter Datenbankentwurf..................................................................................6<br />

3.3.4 Transaktionen in föderierten Datenbanken...............................................................6<br />

3.4 Serviceorientierte Informationsbereitstellung..................................................................7<br />

3.4.1 Überblick zu verteilten Informationssystemen.........................................................7<br />

3.4.2 Enterprise Application Integration............................................................................7<br />

3.4.3 Grundlegende Web Service Technologien................................................................7<br />

3.4.4 Verfügbare Web Services im Internet.......................................................................8<br />

3.5 Ausblick und Zusammenfassung.....................................................................................8<br />

4. Bewertungen, Übungen und Seminararbeit .......................................................................8<br />

4.1 Vorlesungsbegleitende Übungen......................................................................................8<br />

4.2 Seminararbeiten und Workshops.....................................................................................9<br />

4.3 Anforderungen an zu erstellende Protokolle....................................................................9<br />

5. Literaturhinweise..............................................................................................................10<br />

6. Informationen zum Dozenten...........................................................................................11<br />

Anlage – Plan der Vorlesungen/Übungen im WiSe 2013/14...................................................12<br />

Anlage – Seminarthemen im WiSe 2013/14............................................................................13<br />

Anlage – Ausgewählte Beispiele für Seminarthemen..............................................................14<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 2


1. Motivation<br />

Die Verteilung von Daten und Funktionen ist aus den heute verwendeten Informationssystemen<br />

nicht mehr wegzudenken und wird durch verschiedenste Technologien (insbesondere<br />

Middleware) unterstützt. Bereits in den 80-iger Jahren wurde der Aspekt einer Datenverteilung<br />

im Kontext entsprechender Datenbanksysteme aufgegriffen. Dem entsprechend verbirgt<br />

sich hinter dem Begriff eines verteilten Datenbanksystems sowohl in der Theorie, als auch in<br />

der Praxis eine große Vielfalt an möglichen konzeptionellen und implementierungsseitigen<br />

Ansätzen. Klassische verteilte Datenbanksysteme, die auf der Basis nur eines globalen konzeptionellen<br />

Schemas arbeiten, sind in der Praxis verhältnismäßig selten anzutreffen. Die Ursachen<br />

dafür liegen insbesondere in der Schwierigkeit begründet „ein einheitliches Unternehmensdatenmodell“<br />

zu etablieren und konstant zu halten. Aus diesem Grund hat sich vor<br />

ca. 20 Jahren der Begriff föderierter Datenbanksysteme etabliert. Föderierte Datenbanksysteme<br />

gehen von einer weitgehenden Autonomie der zu integrierenden (örtliche verteilten) Datenbanksysteme<br />

aus und berücksichtigen auch den Aspekt der Heterogenität (d.h. den Einsatz<br />

von Datenbankmanagementsystemen – DBMS unterschiedlicher Hersteller bzw. die Berücksichtigung<br />

unterschiedlicher Datenmodelle). Die Implementierung von Verteilungsmechanismen<br />

auf Ebene der Datenbanksysteme stellte sich jedoch im industriellen Umfeld als nicht<br />

optimal heraus. Zwar können Verteilungsanforderungen auf der Grundlage DBMS-eigener<br />

Techniken (wie z.B. Gateways, Datenbank-Links, Replikationsmechanismen) schnell und<br />

zumeist auch pragmatisch befriedigt werden, dennoch implizieren diese Lösungen häufig gravierende<br />

Nachteile. Diese liegen primär in den Aufwänden für die Wartung und Pflege, potentiellen<br />

Sicherheitsrisiken, der zumeist hohen Abhängigkeit von einem Hersteller, der Schwierigkeit<br />

auf neue Anforderungen schnell und abgegrenzt reagieren zu können und in der ungenügenden<br />

Berücksichtigung einer gewachsenen Systemlandschaft.<br />

In jüngster Zeit hat das Internet den Begriff der Verteilung massiv beeinflusst und klassische<br />

Techniken zur Entwicklung verteilter Systeme etwas in den Hintergrund gedrängt. Insbesondere<br />

die Entwicklung verteilter webbasierter Systeme steht heute im Vordergrund industrieller<br />

Aktivitäten und wird häufig unter dem Begriff des e-Business subsumiert. Webbasierte Integrationsansätze<br />

bieten die Möglichkeit heterogene Informationssysteme (inkl. der genutzten<br />

Datenbanken) im Rahmen gemeinsamer Aufgabenstellungen zu integrieren. Insbesondere die<br />

Technologie der Web Services profitiert von diesem Lösungsansatz, weshalb diese Technik<br />

sowohl im Kontext unternehmensinterner, als auch unternehmensübergreifender Integrationsansätze<br />

zunehmend zum Einsatz kommt.<br />

Dennoch müssen klassische Probleme einer Integration, wie z.B. die Abbildung bzw. der<br />

Umgang mit ähnlichen Entitäten und Beziehungen aus verschiedenen Informationssystemen,<br />

auch in höherwertigen Integrationsansätzen gelöst werden. Dafür kann auf die Erkenntnisse<br />

und Konzepte aus dem Umfeld der verteilten Datenbanksysteme zurückgegriffen werden. Bei<br />

höherwertigen Integrationsansätzen verschiebt sich allerdings der Schwerpunkt benötigten<br />

Tätigkeiten. So steht heute die Modellierung und semantische Interpretation entsprechender<br />

Geschäftsobjektmodelle (geschäftsrelevante Funktionen & Daten) und daraus resultierender<br />

Modelle für die Softwareentwicklung im Vordergrund einer Integration. Vereinfacht hat sich<br />

hingegen der Umgang mit den für die Integration benötigten technologischen Lösungsansätzen.<br />

Insbesondere im Kontext einer webbasierten Integration unterliegen diese einem herstellerunabhängigen<br />

Standardisierungsgremium. Sofern die Anbieter entsprechender Softwareprodukte,<br />

wie z.B. Oracle, IBM oder Microsoft, sich an diesen Standards zur Systemintegration<br />

orientieren, kann auf proprietäre Integrationsansätze nur eines DBMS-Anbieters verzichtet<br />

werden kann. Auf dieser Grundlage können die weiter oben genannten Nachteile verteilter<br />

Datenbanksysteme weitgehend vermieden werden.<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 3


2. Zielstellungen<br />

Die Vorlesung richtet sich an alle die einen grundlegenden Einblick zu verteilten Datenhaltungssystemen<br />

bekommen wollen. Dafür wird ausgehend von theoretischen und praktischen<br />

Ansätzen für verteilte Datenbanksysteme und deren implizierten Vor- und Nachteile, auf die<br />

zunehmende Bedeutung von höherwertigen Integrationsansätzen eingegangen. Höherwertige<br />

Integrationsansätze finden sich z.B. mit den modernen EAI-, SOA- oder auch bei Cloudbasierten<br />

Architekturen. Dennoch bleiben auch bei diesen Ansätzen grundlegende Probleme<br />

der semantischen Integration von Datenobjekten erhalten bzw. bedürfen entsprechender Lösungsansätze.<br />

Nach Besuch der Vorlesung sollten die folgenden Kenntnisse bei den Stundenten<br />

vorhanden sein:<br />

o Grundlegende Prinzipien und Lösungsansätze für verteilte Datenbanksysteme,<br />

o Überblick zu den angebotenen Verteilungsmechanismen eines RDBMS,<br />

o Lösungsansätze auf der Basis föderierter Datenbanksysteme,<br />

o Realisierung von Integrationsanforderungen in höheren Schichten,<br />

o Informationsbereitstellung in serviceorientierten Umgebungen,<br />

o Möglichkeiten der Transaktionsverarbeitung in verteilten Systemen,<br />

o Ausblick auf Entwicklungstendenzen<br />

Grundlage der Vorlesung sind die durch den Dozenten im praktischen Kontext gewonnenen<br />

Erfahrungen im Umgang mit industriell anstehenden Integrationsaufgaben. Durch die langjährige<br />

Verantwortung entsprechender Projekte innerhalb des Telekom-Konzerns können durch<br />

den Dozenten vielfältige Praxisproblemen im Rahmen der Vorlesung erörtert werden. Hinsichtlich<br />

der zur Vorlesung zu empfehlenden Literatur soll insbesondere auf [Rahm 1994],<br />

[Conrad 1997], [Knuth et al. 2003] und [Alonso et al. 2004] verwiesen werden.<br />

3. Inhalte der Vorlesung<br />

3.1 Ausgewählte Aspekte von Datenbanken<br />

Der 1. Teil der Vorlesung dient der Wiederholung ausgewählter Sachverhalte im Kontext von<br />

Datenbankmanagementsystemen. Ziel ist es für die folgenden Abschnitte eine gemeinsame<br />

Ausgangsbasis herzustellen, um so das Verständnis für verteilte Datenbanksysteme bzw. Systeme<br />

im Kontext einer verteilten Informationsbereitstellung zu ermöglichen.<br />

3.1.1 Klassische Zielstellungen von Datenbanken<br />

o Dauerhafte und redundanzarme Speicherung von Daten/Informationen<br />

o Gewährleistung von Integritätsbedingungen<br />

o Gewährleistung logischer und physischer Datenunabhängigkeit<br />

3.1.2 Architektur von Datenbankmanagementsystemen<br />

o Basisfunktionalitäten eines Datenbankmanagementsystems<br />

o 3-Ebenen Architektur nach ANSI-SPARC<br />

o Schichten eines DBMS<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 4


3.1.3 Entwurf einer Datenbank<br />

o Phasen des Datenbankentwurfs<br />

o ER-Modellierung und Normalisierung<br />

o Schlüsselkonzept (Primär- und Fremdschlüssel)<br />

3.1.4 Operationen Relationale Datenbankmanagementsysteme<br />

o Selektion (Auswahl von Zeilen/Tupeln)<br />

o Projektion (Auswahl von Spalten)<br />

o Verbundoperation (Join) über zwei Relationen<br />

3.1.5 Der Transaktionsbegriff<br />

o A – Atomicity (Das „alles“ oder „nichts“ Prinzip)<br />

o C – Consistency (Konsistenter Zustand der Datenbank)<br />

o I – Isolation (Isolierter Ablauf paralleler Transaktionen)<br />

o D – Durability (Dauerhafte Speicherung von Transaktionsergebnissen)<br />

3.2 Besonderheiten verteilter Datenbanksysteme<br />

Im Rahmen des 2. Teils der Vorlesung wollen wir auf den klassischen Ansatz verteilter Datenbanksysteme<br />

eingehen. Neben der Vorstellung ausgewählter Aufgabenstellungen im Kontext<br />

des Einsatzes solcher Systeme, soll im abschließenden Teil auch die aktuell vorhandene<br />

Unterstützung für eine verteilte Verarbeitung innerhalb des Datenbankmanagementsystems<br />

Oracle vorgestellt werden.<br />

3.2.1 Anforderungen an verteilte Datenbanken<br />

o Übersicht und Einführung<br />

o 12 Anforderungen für verteilte Datenbanken<br />

o Leistungstransparenz und grobe Definition<br />

3.2.2 Architektur verteilter Datenbanken<br />

o 4-Ebenen Architektur<br />

o Globales konzeptuelles- und Verteilungs-Schema<br />

o Lokales konzeptuelles- und lokales internes Schema<br />

3.2.3 Katalogverwaltung<br />

o Aufgaben der Katalogverwaltung<br />

o Lokaler vs. globaler Katalog<br />

o Arten der Katalogverwaltung und Bewertung<br />

3.2.4 Entwurf verteilter Datenbanken<br />

o Aufgaben beim Entwurf eines verteilten DBS<br />

o Fragmentierung und Allokation<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 5


o Arten der Fragmentierung (Horizontal, Vertikal, Gemischt)<br />

3.2.5 Transaktionsverwaltung in verteilten DBS<br />

o Struktur verteilter Transaktionen<br />

o Sicherstellung der Transaktionsbedingungen<br />

3.2.6 Verteilte Datenbanken mit Oracle<br />

o Datenbank- und Netzwerksunterstützung für verteilte Systeme<br />

o Verwendung von Oracle Datenbank-Links<br />

3.3 Föderierte Datenbanksysteme<br />

In der Praxis ist es schwer den klassischen Ansatz (siehe Abschnitt 3.2) für ein verteiltes Datenbanksystem<br />

auch tatsächlich umzusetzen. Hier gilt es zumeist langjährig bestehende Systeme<br />

zu integrieren. Dabei ergibt sich häufig das Problem der Heterogenität, d.h. weder die<br />

eingesetzten Netzwerk- und Betriebssysteme, noch die verwendeten Datenbankmanagementsysteme<br />

sind von einem Hersteller. Föderierte Datenbanksysteme erlauben die Integration<br />

unterschiedlicher Systeme, die dabei auftretenden Besonderheiten sollen im 3. Teil der Vorlesung<br />

besprochen werden.<br />

3.3.1 Zielstellungen föderierter Datenbanksysteme<br />

o Einsatzgebiete und Anwendungsszenarien<br />

o Integration existierender Datenbestände<br />

o Migration – schrittweise Ablösung von Altsystemen<br />

3.3.2 Referenzarchitekturen für föderierte Datenbanken<br />

o Import-/Export-Schema-Architektur<br />

o Multidatenbank-Architektur<br />

o 5-Ebenen-Schema-Architektur<br />

3.3.3 Föderierter Datenbankentwurf<br />

o Erhaltung der Autonomie bestehender Datenbestände<br />

o Schematransformation und Schemaintegration<br />

o Integrationsstrategien & Integrationsprozess<br />

o Ausgewählte Integrationskonflikte<br />

3.3.4 Transaktionen in föderierten Datenbanken<br />

o Heterogene Transaktionsverwaltung in föderierten Systemen<br />

o Geschachtelte Transaktionen in föderierten Systemen<br />

Wenngleich der Ansatz eines föderierten Datenbanksystems nicht mit einem industriellen<br />

Produkt gleichgesetzt werden kann, bietet sich mit den dabei herausgearbeiteten Konzepten<br />

eine ideale Grundlage für höherwertige Integrationsansätze. Dem entsprechend stellen diese<br />

eine fundierte Basis für z.B. webbasierte Systemintegrationen dar. Im Kontext dieses Abschnittes<br />

sei insbesondere auf die umfangreichen konzeptionellen Darstellungen in [Conrad<br />

1997] verwiesen.<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 6


3.4 Serviceorientierte Informationsbereitstellung<br />

Moderne Lösungsansätze verlagern die Integration von vorhandenen Systemen und den dahinter<br />

liegenden Datenbeständen in höher gelagerte Schichten der Anwendung. In diesem<br />

Zusammenhang wird häufig von entsprechender Middleware gesprochen. Im Rahmen des 4.<br />

Teils (Bestandteil des folgenden Semesters) der Vorlesung wollen wir auf derartige Ansätze<br />

eingehen.<br />

3.4.1 Überblick zu verteilten Informationssystemen<br />

o Potentielle Architekturansätze<br />

o Kommunikationsbeziehungen (synchron vs. asynchron)<br />

o Middleware (RPC, CORBA und MOM)<br />

o Grundlegende Web-Technologien (Protokolle und Generationen)<br />

o Application Server als Integrationsplattformen.<br />

3.4.2 Enterprise Application Integration<br />

o Historische Entwicklung und Zielstellungen von EAI<br />

o Schichtenmodell der Applikationsintegration<br />

o Integrationslevel<br />

o Datenaustausch mit XML<br />

o Dienste von EAI-Lösungen<br />

o Produkte im EAI-Umfeld<br />

3.4.3 Grundlegende Web Service Technologien<br />

o XML als Datenbeschreibungssprache<br />

o Schemadefinition als Grammatik von XML-Dokumenten<br />

o XML Frameworks (ebXML, XML/EDI)<br />

o XML Vokabulare (cXML, xCBL)<br />

o SOAP – Simple Object Access Protocol<br />

o Aufbau und Struktur<br />

o RPC- und DOC-orientierte Arbeitsweise<br />

o WSDL – Spezifikation von Web Services<br />

o Struktur und Elemente eines WSDL-Interfaces<br />

o Implikationen des WSDL-Modells<br />

o WSDL-Programmierungstechniken<br />

o Weitere Ansätze bzw. Architekturvorschläge<br />

o REST Architekturstil<br />

o JSON-Services<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 7


3.4.4 Verfügbare Web Services im Internet<br />

o Überblick zu verfügbaren Web Service Verzeichnissen<br />

o Auffinden von Web Services<br />

o Art der derzeit im Internet angebotenen Web Services<br />

o Empirische Betrachtungen zu verfügbaren Web Services<br />

o Identifizierung über die Basistechnologien hinausgehender Ansätze.<br />

3.5 Ausblick und Zusammenfassung<br />

o Datenbanken zur Verwaltung von XML-Dokumenten<br />

o XML-Anfragesprachen (XQuery und XPath)<br />

o Feedback zur Vorlesung<br />

4. Bewertungen, Übungen und Seminararbeit<br />

4.1 Vorlesungsbegleitende Übungen<br />

Im Rahmen der Vorlesung werden teamorientierten Übungen bearbeitet. Diese sind durch<br />

jeweils 2 bis 4 Studenten im Team umzusetzen. Bei den Übungen handelt es sich um grundlegende<br />

Problemstellungen verteilter Datenbanksysteme bzw. die modelltechnische Erfassung<br />

von Integrationsaspekten. Die Verwendung von Referenzdatenmodellen stellt darüber hinaus<br />

einen möglichen Ansatz zur Standardisierung einer unternehmensinternen, aber auch unternehmensübergreifenden<br />

Datenmodellierung dar. Im Einzelnen handelt es sich bei den Übungen<br />

um die folgenden Themen:<br />

1. Anforderungen an verteilten Datenhaltungssysteme (Brainstorming/Metaplan)<br />

2. Mögliche Verteilungsmechanismen/-Techniken in konkreten RDBMS-Produkten<br />

3. Erstellung eines föderierten Datenbankschema (zusicherungsbasierte Integration)<br />

4. Verwendung von Referenzdatenmodellen in serviceorientierten Umgebungen<br />

Auf der Grundlage zweier bewerteter Übungen wird eine Vornote ermittelt, die mit 50% in<br />

die Gesamtbewertung des Semesters eingeht. Die Bewertung der Übungen setzt sich aus den<br />

Protokollen und jeweils einem Kurzvortrag (10 min + 5 min Fragen) zusammen. Die Bewertung<br />

des Kurzvortrags erfolgt anhand der folgenden Kriterien:<br />

- Inhalt – Aufgabentreue und ggf. benötigte Abgrenzungen<br />

- Struktur – Gewährleistung eines roten Faden durch die Themenstellung<br />

- Kritik – Kritische Würdigung der bearbeiteten Themen<br />

- Präsentations-Stil – Köpersprache, Begeisterung und Medieneinsatz<br />

- Zeittreue – Einhaltung des vorgegebenen Zeitlimits<br />

- Form – grafische Aufbereitung der behandelten Themen<br />

- Fragen – Umgang mit Fragen während bzw. nach der Präsentation<br />

Auch wenn nur 2 Übungen in die Bewertung eingehen setzt der erfolgreiche Abschluss die<br />

Durchführung aller 4 Übungen voraus!<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 8


4.2 Seminararbeiten und Workshops<br />

Die Inhalte der Seminararbeiten sind mit dem Dozenten ca. 1 Monat vor dem Ende des Semesters<br />

abzusprechen. Dabei kann sowohl ein eigener Themenvorschlag, als auch ein durch<br />

den Dozenten bereitgestelltes Thema (ausgewählte Beispiele siehe Anlage innerhalb dieser<br />

<strong>Studienanleitung</strong>) bearbeitet werden. Sofern die Seminararbeit mit mindestens genügend bestanden<br />

wird, setzt sich die Bewertung des Fachs zu 50% aus den Übungsergebnissen und zu<br />

50% aus der Seminararbeit (Referat/Beleg) zusammen. Die Bewertung des Referats erfolgt<br />

unter Verwendung der bereits bei den Übungsvorträgen verwendeten Bewertungskriterien.<br />

Aus inhaltlicher Sicht bedarf es, unabhängig von der bearbeiteten Themenstellung, der Berücksichtigung<br />

(Analyse/Bewertung) der Dimensionen eines verteilten Datenbanksystems in<br />

Bezug auf „Verteilung“, „Heterogenität“ und „Autonomie“.<br />

Grundsätzlich sollte die Seminararbeit eine wissenschaftliche Herangehensweise aufzeigen<br />

und den folgenden strukturellen Aufbau besitzen. Der Umfang sollte etwa 10 bis 15 Seiten<br />

betragen, ggf. können Anlagen für Untersuchungsergebnisse verwendet werden.<br />

- Zielstellung,<br />

- Grundlagen zum Thema,<br />

- durchgeführte Analysen,<br />

- ggf. erarbeitete konzeptionelle Aspekte,<br />

- ggf. realisierte prototypische Implementierungen,<br />

- Zusammenfassung & Ausblick<br />

- Quellenverzeichnis<br />

Die Abgabe der Arbeit erfolgt in elektronische Form (Präsentation und Seminararbeit) bis<br />

zum 19. Februar 2014 (strikt einzuhalten) über die folgende email-Adresse an der Universität<br />

Magdeburg: schmiete@ivs.cs.uni-magdeburg.de<br />

4.3 Anforderungen an zu erstellende Protokolle<br />

Grundsätzlich sollten alle anzufertigenden Protokolle die folgende Struktur berücksichtigen:<br />

- Allgemeine Angaben<br />

a. Versuch, Beteiligte Studenten, Datum<br />

b. Rahmenbedingungen (Software, Hardware, …)<br />

c. Methodisches Vorgehen zu Bearbeitung<br />

- Aufgaben des Laborversuchs<br />

a. Aufgabenstellung<br />

b. Textliche Ausführungen zu den Lösungen<br />

c. Verwendung von Grafiken und Screenshots<br />

- Zusammenfassung (Bewertung der erreichten Ergebnisse)<br />

- Genutzte Quellen (z.B. Literatur, Internet, …)<br />

Die Abgabe der Protokolle erfolgt in elektronische Form (Präsentationen und Protokolle) bis<br />

zum 19. Februar 2014 (strikt einzuhalten) über die folgende email-Adresse an der Universität<br />

Magdeburg: schmiete@ivs.cs.uni-magdeburg.de<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 9


5. Literaturhinweise<br />

Die im Folgenden kurz vorgestellten Literaturhinweise bieten eine Übersicht zu weiterführenden<br />

Information, zu den im Kontext der Vorlesung vermittelten Themengebieten. Die dabei<br />

gewählte Reihenfolge widerspiegelt die Stärke des Bezugs zur Vorlesung, d.h. auf die Inhalte<br />

der letzt genannten Bücher wird im Rahmen der Vorlesung nur geringer Bezug genommen.<br />

[Rahm 1994] Rahm, E.: Mehrrechner-Datenbanksysteme – Grundlagen der verteilten und<br />

parallelen Datenverarbeitung, Addison-Wesley, Bonn, 1994<br />

[Conrad 1997] Conrad, S.: Föderierte Datenbanksysteme – Konzepte der Datenintegration,<br />

Springer-Verlag, Berlin, 1997<br />

[Dostal 2005] Dostal, W.; Jeckle, M.; Melzer, I.; Zengler, B.: Service-orientierte Architekturen<br />

mit Web Services (Konzepte – Standards – Praxis), Spektrum Akademischer Verlag,<br />

München, 2005<br />

[Knuth et al. 2003] Knuth, M. et al.: Web Services – Einführung und Übersicht, Software<br />

Support Verlag, Frankfurt, 2003<br />

[Alonso et al. 2004] Alonso, G.; Casati, F.; Kuno, H.; Machiraju, V.: Web Services, Springer-<br />

Verlag, Berlin 2004<br />

[Seemann 2003] Seemann, M.: Native XML-Datenbanken im Praxiseinsatz, Software Support<br />

Verlag, Frankfurt, 2003<br />

[Kemper/Eickler] Kemper, A.; Eickler, A: Datenbanksysteme – Eine Einführung, Oldenbourg-Verlag,<br />

München Wien, 2004<br />

[Sneed/Sneed] Sneed, H.; Sneed, S. H.: Web-basierte Systemintegration, Vieweg-Verlag,<br />

Braunschweig/Wiesbaden, 2003<br />

[Chappell/Jewell] Chappell, D. A.; Jewell, T.: Java Web Services, O`Reilly-Verlag, Sebastopol/CA,<br />

2002<br />

[Chappell 2002] Chappell, D. A.: Enterprise Service Bus – Theorie in Practice, O`Reilly-<br />

Verlag, Sebastopol/CA, 2002<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 10


6. Informationen zum Dozenten<br />

Andreas Schmietendorf arbeitet als Professor für Wirtschaftsinformatik (Systementwicklung)<br />

an der Hochschule für Wirtschaft und Recht Berlin (Berlin School of Economics and Law).<br />

Daneben hält er eine Privatdozentur für Software-Engineering an der Otto-von-Guericke-<br />

Universität Magdeburg. Seine berufliche und wissenschaftliche Entwicklung im Bereich der<br />

Informationsverarbeitung ist eng mit seiner Tätigkeit bei der Deutschen Telekom AG verbunden,<br />

bei der er mehr als zwölf Jahre beschäftigt war. Bis zu seinem Ruf auf eine Datenbankprofessur<br />

an die Hochschule Harz im Jahr 2004 arbeitete er als Abteilungsleiter und Chefarchitekt<br />

beim Entwicklungszentrum Berlin innerhalb des Telekom-Konzerns.<br />

Nach wie vor berät er Industrieunternehmen bzw. die öffentliche Verwaltung zu ausgewählten<br />

Problemstellungen wie z.B. dem Management komplexer Entwicklungs- und Integrationsprojekte<br />

oder auch zu Fragen des Geschäftsprozessmanagements. Ebenso ist er Vizepräsident der<br />

Central Europe Computer Measurement Group (ceCMG), Beirat des Arbeitskreises Software-<br />

Qualität und -Fortbildung e.V. (ASQF), Partner der Deutschsprachigen Anwendergruppe für<br />

Software-Metrik und Aufwandschätzung (DASMA). Darüber hinaus rief er im Jahr 2006 die<br />

BSOA-Initiative ins Leben, in deren Rahmen er den jährlich stattfindenden Workshop „Bewertungsaspekte<br />

service- und cloudbasierter Architekturen“ durchführt.<br />

Ausgewählte Referenzprojekte der letzten Jahre:<br />

- Durchführung von Qualitäts- und Kostenbewertungen im Rahmen des Integrationsprojektes<br />

„DualPhone“. (Partner: T-Systems Berlin) - 2006<br />

- Einsatz moderner Integrationsarchitekturen im Bereich der öffentlichen Verwaltung<br />

und bei Bundesbehörden (Partner: IBM Deutschland GmbH) - 2007<br />

- Beratungsleistungen im Projekt „SOA-E2E Management“, speziell SOA-Vorgehen<br />

und SOA-Bewertungsaspekte (Partner: T-Systems Berlin) - 2007<br />

- Vorgehensweise und Konzeption einer flächendeckenden Geschäftsprozessanalyse bei<br />

einer verteilten Organisation (Partner: Bundesarchiv) – 2008<br />

- Vorbereitung und Durchführung von Spezialseminaren zu den Möglichkeiten von Referenzmodellen,<br />

konkret BPMN, ITIL und SID (Partner: T-Systems Berlin) - 2008<br />

- Gutachten zur Auswahl eines Modellierungs- und Simulationswerkzeugs im Kontext<br />

der Anforderungen des Projektes BIS (Partner: Deutsche Telekom AG) - 2009<br />

- Bewertung des Architekturkonzepts innerhalb des Innovationsprojektes zur Entwicklung<br />

einer Prozess- und Service-Plattform (Partner: T-Systems Berlin) – 2009<br />

- Redesigns der Datenbankzugriffsschicht einer existierenden Applikation unter Zuhilfenahme<br />

eines Object-Relational-Mappings (Partner: T-Systems Berlin) – 2012<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 11


Anlage – Plan der Vorlesungen/Übungen im WiSe 2013/14<br />

Raum: 5.301, Donnerstag ab 09:45<br />

Bachelor - Wirtschaftsinformatik (5. Semester)<br />

Vorlesung Termin Vorlesung Übung<br />

01 12.09.2013 Einführung zur Vorlesung und Informationen<br />

zu Belegarbeiten<br />

02 26.09.2013 Ausgewählte Aspekte von Datenbanken<br />

(Grenzen nicht verteilter Systeme)<br />

Übung 1: Metaplantechnik<br />

03 10.10.2013 Besonderheiten verteilter Datenbanksysteme<br />

04 17.10.2013 Besonderheiten verteilter Datenbanksysteme<br />

Übung: 2 Verteilungsmechanismen<br />

von DBMS<br />

05 24.10.2013 Besonderheiten verteilter Datenbanksysteme<br />

06 20.11.2013 Besonderheiten verteilter Datenbanksysteme<br />

07 21.11.2013 Föderierte Datenbanksysteme Übung 3: Föderierter<br />

DB-Entwurf<br />

08 28.11.2013 Föderierte Datenbanksysteme<br />

09 05.12.2013 Föderierte Datenbanksysteme Übung 4: Referenzdatenmodelle<br />

10 12.12.2013 Entwicklungstendenzen<br />

11 19.12.2013 Auswertung Referenzdatenmodelle<br />

12/13 09.01.2014 Prüfungen durchgeführt im Block Seminarvorträge<br />

14/15 16.01.2014 Prüfungen durchgeführt im Block Seminarvorträge<br />

Die terminliche Zuordnung der dargestellten Themen stellt nur eine grobe Orientierung dar,<br />

hier kann es je nach Lernfortschritt noch zu geringfügigen Verschiebungen kommen. Zur<br />

Vorbereitung und Abstimmung kann es darüber hinaus zu zusätzlichen Terminen innerhalb<br />

des Dezembers kommen.<br />

Die Termine für die Seminarvorträge sind offizielle Prüfungen der HS Harz. Auf der Grundlage<br />

dieser Seminarvorträge (ca. 20 min) und einer entsprechenden Belegarbeit bzw. Entwurfsarbeit<br />

(10-15 Seiten) wird das Fach durch jeden einzelnen Studenten abgeschlossen.<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 12


Anlage – Seminarthemen im WiSe 2013/14<br />

Name Thema Präsentations-<br />

Termin<br />

N.N.<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 13


Anlage – Ausgewählte Beispiele für Seminarthemen<br />

Die vorgestellten Themen für Seminararbeiten geben eine Anregung zu potentiell lösbaren<br />

Aufgabenstellungen. Die dabei angegebenen Stichpunkte dienen der groben Orientierung inhaltlich<br />

zu bearbeitender Themengebiete, die Erarbeitung einer korrespondierenden Gliederung<br />

obliegt allerdings dem konkreten Bearbeiter. Dabei ist sowohl die Einordnung, aber auch<br />

die Abgrenzung zu nicht behandelten Themen zu berücksichtigen. In diesem Zusammenhang<br />

sollten die aufgezeigten Stichpunkte konkretisiert werden. Die Ausarbeitung sollte sich an der<br />

unter Abschnitt 4 vorgestellten Vorgehensweise orientieren.<br />

1. Optimierung von DB-Anfragen in verteilten Datenbanksystemen<br />

- Problemstellung der Anfrageoptimierung bei verteilten DBS<br />

- Umgang mit redundanten Daten und Inkonsistenzen<br />

- Möglichkeiten des Query-Optimizers<br />

2. Analyse des Transparenzbegriffes im Rahmen einer SOA<br />

- Darstellung möglicher Sichten<br />

- Transparenz im Kontext abzubildender Geschäftsprozesse<br />

- Transparenz aus Sicht der Entwicklung & Wirkbetrieb<br />

3. Aspekte der Normalisierung bei verteilten Datenbanksystemen<br />

- Zielstellungen der klassischen Normalisierung (1. NF, 2. NF, 3. NF)<br />

- Abbildung eines relationalen DB-Entwurfs auf ein verteiltes DBS<br />

- Denormalisierung (Zielstellungen und Umgang mit Redundanzen)<br />

4. Notationen für die Modellierung verteilter Datenbanksysteme<br />

- Klärung des Begriffes einer Notation<br />

- Analyse verfügbarer Notationen (ER-Modellierung, UML, …)<br />

- Besonderheiten der Modellierung verteilter Datenbanksysteme<br />

5. Durchgängigkeit von Funktions- und Datenmodellierung<br />

- Modellierung im Lebenszyklus eines Softwareproduktes<br />

- Analyse verfügbarer Notationen (BPMN, EPK, BPEL, ER-Modellierung, UML, …)<br />

- Business-Datenmodell, Business-Objektmodell, Business-Servicemodell<br />

6. Partitionierung von Daten mit Hilfe einer Verteilungs- und Konfigurationsanalyse<br />

- Analyse genutzter Daten & Nutzerprofile<br />

- Kriterien zur Verteilung von Katalogdaten in einem VDBS<br />

- Monitoring der tatsächlichen Datennutzung<br />

7. Fragmentierungs- und Allokationstransparenz<br />

- Gebotene Werkzeugunterstützung (Verteilungsentwurf)<br />

- Gewährleistung der Redundanzfreiheit<br />

- Abbildung von Abfragen über verteilten Relationen<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 14


8. Transaktionsbehandlung in Web Service-basierten Systemen<br />

- Überblick zu Web Service-basierten Integrationslösungen<br />

- Transaktionsprotokolle für verteilte Systeme<br />

- WS Coordination & WS Transaction<br />

9. Datenbankschnittstellen im Kontext von VDBS<br />

- Überblick zu existierenden Schnittstellen (JDBC, ODBC, XA, XA+, …)<br />

- Persistenzschichten – Mapping zwischen Anwendung & Datenbank<br />

- Realisierung von verteilten DBS<br />

10. XML-Datenbanken und verteilte DBS<br />

- Überblick zu XML-basierten DBS<br />

- Abbildung von Verteilungseigenschaften<br />

- Interoperabilität zu anderen DBS (z.B. ORDBMS, OODBMS)<br />

11. Einsatz von Middlewaretechnologien im Kontext VDBS<br />

- Begriff der Middleware klären (Ziele, Gegenstand, Einsatzbereiche, …)<br />

- Beispiele konkreter Middlewareansätze (DCE, CORBA, RMI, …)<br />

- Einsatzmöglichkeiten bei der Realisierung föderierter DBS<br />

12. Verteilte DBS im Bereich von Multimediaanwendungen<br />

- Besonderheiten multimedialer Daten (vgl. zu Daten eines klass. RDBMS)<br />

- Industrielle & akademische Beispiele für VDBS<br />

- Integrationsaspekte zu anderen DBS (Schwerpunkt: RDBMS)<br />

13. Möglichkeiten zur Serialisierung von Objekten unter Java<br />

- Begriff der Serialisierung einordnen<br />

- Klassischer und fortgeschrittene Serialisierungsmechanismen unter Java<br />

- Serialisierung im Kontext eines verteilten DBS<br />

14. Empirische Analyse zu verfügbaren Referenzdatenmodellen<br />

- Zielstellung von Referenzdatenmodellen<br />

- Verfügbare Ansätze in verschiedenen Branchen<br />

- Beispielhafte Darstellung des Einsatzes über entsprechende Tools<br />

15. Schemaintegration und Schemamigration<br />

- Ziele der Schemaintegration und Schemaintegration<br />

- Analyse verfügbarer Integrationsmethoden<br />

- Darstellung eines konkreten Beispiels, wie z.B. XML-basierte Schemaintegration<br />

16. NoSQL-Datenbanken (not only SQL) im Internet<br />

- Eigenschaften von NoSQL-Darenbanken<br />

- Verteilte Datenverarbeitung im Kontext des CAP-Theorems<br />

- Einsatzgebiete für NoSQL-Datenbanken<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 15


17. Spaltenorientierte Datenbanksysteme<br />

- Besonderheiten spaltenorientierter Datenbanken (Bezug zu OLAP)<br />

- Spaltenorientierte Anfrage-Ausführung<br />

- Beispiele für konkrete Systeme<br />

18. Big Data Applikationen<br />

- Historie zur Entstehung und Identifikation möglicher Einsatzszenarien<br />

- Open-Source-Frameworks „Hadoop“ und NoSQL-Datenbank „HBase“<br />

- Skalierbarkeit und Performance<br />

Verteilte DBS I - Vorlesung 22.11.2013<br />

HS Harz WiSe13, A. Schmietendorf Seite 16

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!