Extensible Markup Language (PDF) - IT-Dienstleistungszentrum Berlin
Extensible Markup Language (PDF) - IT-Dienstleistungszentrum Berlin
Extensible Markup Language (PDF) - IT-Dienstleistungszentrum Berlin
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
ç die Arbeit abnehmen können, waren – bedingt durch die Komplexität – ebenfalls<br />
rar Dieses Problem erkannten auch die Autoren von SGML, und so gingen die<br />
Bemühungen fast nahtlos dazu über, eine vereinfachte Version von SGML zu<br />
definieren: XML Im Jahre 1996 wurde vom Word Wide Web Consortium (W3C) die<br />
erste Version von XML vorgestellt, 1998 wurde XML 10 bereits zum Standard<br />
erhoben<br />
Für die Definition der Grammatik kann<br />
entweder die von SGML übernommene<br />
Dokumenttypdefinition (DTD, s Abbildung<br />
2) oder das für XML neu entwickelte<br />
XML-Schema (su) eingesetzt<br />
werden<br />
Das universelle Datenformat<br />
War der ursprüngliche Zweck von XML eine erweiterbare Sprache für das World<br />
Wide Web, wurde schnell erkannt, dass sich XML für viele weitere Anwendungen<br />
eignet XML kann zB Datensätze einer Datenbank darstellen, Nachrichten, die<br />
zwischen Informationssystemen ausgetauscht werden, repräsentieren, Systemkonfigurationen<br />
speichern und vieles andere, wozu bisher proprietäre Lösungen<br />
eingesetzt wurden Für jede dieser Anwendungen kann in XML eine eigene Sprache,<br />
ein eigenes Datenformat definiert werden, das sich aber an einige Grundregeln halten<br />
muss, Regeln, die das Wesen von XML ausmachen und ermöglichen, wiederverwendbare<br />
Software dafür zu schreiben Daher wird auch der Begriff XML-Daten<br />
für XML-Dokumente verwendet XML-Dokumente sind bedingt menschenlesbar,<br />
das Wesentliche ist aber, dass sie maschinenlesbar sind<br />
Wurzelelement<br />
Kindelement des<br />
Wurzelelements<br />
<br />
<br />
<br />
<br />
<br />
<br />
BETRIEBSFLÄCHE<br />
398<br />
<br />
<br />
<br />
REINHARDTSTR. 49 in 10117<br />
<br />
<br />
<br />
<br />
Abbildung 1: Einfaches XML-Dokument<br />
Attribut<br />
Element<br />
reiner Text<br />
In Abbildung 1 ist ein einfaches XML-Dokument dargestellt Auf den ersten Blick<br />
sind wenige Unterschiede zu HTML festzustellen Ein XML-Dokument besteht aus<br />
Markierungen und reinem Text Durch die Markierungen werden sog Elemente und<br />
Attribute gebildet Elemente können andere Elemente, Attribute oder reinen Text<br />
enthalten Alle diese Teile werden auch Knoten genannt XML-Dokumente besitzen<br />
eine Baumstruktur Sie haben ein Wurzelelement Alle anderen Knoten sind dessen<br />
direkte (dh Kinder) oder indirekte Nachkommen<br />
Wie dargestellt, sind XML-Dokumente selbst wiederum reiner Text Um Markierungen<br />
von dem eigentlichen Text (Inhalt) zu unterscheiden, sind diese in sog Tags<br />
(Etiketten) verpackt, die an den spitzen Klammern zu erkennen sind Deswegen darf<br />
der eigentliche Text diese (und einige andere reservierte Zeichen) nicht enthalten –<br />
dafür ist eine besondere Notation definiert Die XML-Spezifikation definiert, wie die<br />
Markierungen aussehen müssen und wie die Baumstruktur durch den reinen Text<br />
dargestellt wird Diese Definition ist unabhängig von der Art des XML-Dokuments<br />
Für jede Art von XML-Dokumenten, also für jede Anwendung, kann eine Grammatik<br />
definiert werden Eine Grammatik ist ein Satz von Regeln, aufgrund dessen eine<br />
eindeutige Aussage möglich ist, ob ein Dokument zu der jeweiligen Dokumentenart<br />
gehört oder nicht Wenn XML zur Kommunikation zwischen Anwendungen verwendet<br />
wird, muss die Grammatik in der Software auf beiden Seiten bekannt sein<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
Abbildung 2: DTD für das Dokument in<br />
Abbildung 1<br />
Diese DTD sagt aus, dass es die Elemente<br />
address, addresses, blis, part,<br />
result, results, size, use und parts gibt<br />
Das Element blis hat genau ein Kindelement<br />
vom Typ results und zwei<br />
Pflichtattribute, doc und title Beide<br />
Attribute haben normalen Text als Wertebereich<br />
Das Element results muss<br />
einen oder mehrere Elemente vom Typ<br />
result enthalten Diese wiederum bestehen<br />
aus einem Element vom Typ parts<br />
und einem Element vom Typ adresses<br />
Für die restlichen Elemente gilt das<br />
Entsprechende<br />
Teile eines Ganzen<br />
XML ist eine stabile Grundlage, kann<br />
aber nicht für sich allein existieren Es<br />
gibt bereits mehrere Dutzend Standards,<br />
die auf XML basieren bzw XML erweitern<br />
(im Sinne des Namens XML) Hier<br />
werden nur einige im Zusammenhang<br />
mit Web-Anwendungen interessante<br />
Standards kurz umrissen:<br />
XML Path <strong>Language</strong> (XPath)<br />
Um die Position eines Knotens im Baum<br />
eines XML-Dokuments zu beschreiben,<br />
ist eine Notation nötig Diese ist in der<br />
XPath-Spezifikation definiert XPath-<br />
Ausdrücke können einzelne Knoten oder<br />
Mengen von Knoten neben ihrer Position<br />
im Baum auch noch<br />
è<br />
1/02 2 9 7