Funcionalidad 4: Almacenes de Datos y Bases de Datos XML ...

Funcionalidad 4: Almacenes de Datos y Bases de Datos XML ... Funcionalidad 4: Almacenes de Datos y Bases de Datos XML ...

alarcos.inf.cr.uclm.es
from alarcos.inf.cr.uclm.es More from this publisher
13.08.2013 Views

MMAABBDD Funcionalidad 4: Almacenes de Datos y Bases de Datos XML 10 BASES DE DATOS XML Introducción El Lenguaje de marcas extensible (XML) no se concibió como una tecnología para bases de datos inicialmente. Al igual que el lenguaje HTML, XML tiene sus raíces en la gestión de documentos y está derivado de un lenguaje para estructurar documentos grandes. Sin embargo, XML puede representar datos de bases de datos, así como muchas clases de datos estructurados. Resulta de gran utilidad como formato de datos cuando las aplicaciones se deben comunicar con otra aplicación o integrar información de varias aplicaciones. Los principales motivos de la aparición de las bases de datos XML son la proliferación de la Web y la necesidad creciente de compartir información estructurada dentro de las empresas ó con otras empresas. Por lo tanto se deduce la necesidad de crear un nuevo tipo de base de datos que resuelva estos problemas. Para comprender las bases de datos XML es importante conocer sus raíces como un lenguaje de marcas de documentos. Por el concepto de marca entendemos cualquier elemento en un documento del que no se tiene intención que sea parte de la salida impresa. Las bases de datos XML permiten presentar información estructurada, ya que esta viene definida por las marcas de los distintos archivos. Documentos XML El constructor en un documento XML es el elemento. Los documentos XML deben de tener un único elemento raíz que abarque al resto de elementos donde los elementos hijos del elemento raíz se deben anidar adecuadamente. Las representaciones anidadas se usan ampliamente en las aplicaciones de intercambio de datos XML. Por tanto, la estructura de etiquetas anidadas dentro de un archivo XML hace que se disponga de una estructura de árbol. Características de los documentos XML: Posee mensajes auto-documentados: no se tiene que consultar un esquema para comprender el significado del texto. El formato del documento no es rígido: se puede agregar información adicional tal como etiquetas XML permite estructuras anidadas: En un modelo relacional el anidamiento lo tendríamos que incluir en una tabla aparte, por lo que en bases de datos relacionales esto no era posible Gran variedad de herramientas disponibles para ayudar a su procesamiento

MMAABBDD Funcionalidad 4: Almacenes de Datos y Bases de Datos XML 11 Esquema de los documentos XML: Definición de tipos de documentos (DTD): Es una parte opcional de un documento XML. Su propósito es restringir el tipo de información presente en el documento, de forma que restringe el aspecto de los subelementos y atributos de un elemento. XML Schema: Se trata de un intento de reparar las deficiencias del mecanismo DTD, ampliando el sistema de tipos. XML Schema define varios tipos predefinidos como string, integer, bolean, etc y también permite tipos definidos por el usuario. Lenguajes de navegación Los lenguajes utilizados para transformar y consultar los datos son esenciales para la extracción de información de datos XML así como para convertir los datos entre distintas representaciones en XML. Dado que XML representa datos semiestructurados, es importante la existencia de lenguajes de consulta que combinen las características de los lenguajes tradicionales de consulta de datos con los lenguajes de recuperación de información. En todos los lenguajes se usa un modelo de árbol de datos XML a la hora de realizar las consultas. Cada documento es por tanto un árbol con nodos siendo los nodos elementos o atributos con las siguientes propiedades: Tan solo en el caso de que el nodo sea un elemento puede tener nodos hijos. (Cada nodo distinto del nodo raíz tiene un nodo padre que es un elemento). El orden de elementos y atributos en el documento XML se modela ordenando los nodos hijos del árbol. El nodo raíz tiene un único hijo, que es el elemento raíz del documento.

MMAABBDD <strong>Funcionalidad</strong> 4:<br />

<strong>Almacenes</strong> <strong>de</strong> <strong>Datos</strong> y <strong>Bases</strong> <strong>de</strong> <strong>Datos</strong> <strong>XML</strong><br />

10<br />

BASES DE DATOS <strong>XML</strong><br />

Introducción<br />

El Lenguaje <strong>de</strong> marcas extensible (<strong>XML</strong>) no se concibió como una tecnología para<br />

bases <strong>de</strong> datos inicialmente. Al igual que el lenguaje HTML, <strong>XML</strong> tiene sus raíces en la gestión<br />

<strong>de</strong> documentos y está <strong>de</strong>rivado <strong>de</strong> un lenguaje para estructurar documentos gran<strong>de</strong>s. Sin<br />

embargo, <strong>XML</strong> pue<strong>de</strong> representar datos <strong>de</strong> bases <strong>de</strong> datos, así como muchas clases <strong>de</strong> datos<br />

estructurados. Resulta <strong>de</strong> gran utilidad como formato <strong>de</strong> datos cuando las aplicaciones se <strong>de</strong>ben<br />

comunicar con otra aplicación o integrar información <strong>de</strong> varias aplicaciones.<br />

Los principales motivos <strong>de</strong> la aparición <strong>de</strong> las bases <strong>de</strong> datos <strong>XML</strong> son la proliferación<br />

<strong>de</strong> la Web y la necesidad creciente <strong>de</strong> compartir información estructurada <strong>de</strong>ntro <strong>de</strong> las<br />

empresas ó con otras empresas. Por lo tanto se <strong>de</strong>duce la necesidad <strong>de</strong> crear un nuevo tipo <strong>de</strong><br />

base <strong>de</strong> datos que resuelva estos problemas.<br />

Para compren<strong>de</strong>r las bases <strong>de</strong> datos <strong>XML</strong> es importante conocer sus raíces como un<br />

lenguaje <strong>de</strong> marcas <strong>de</strong> documentos. Por el concepto <strong>de</strong> marca enten<strong>de</strong>mos cualquier elemento en<br />

un documento <strong>de</strong>l que no se tiene intención que sea parte <strong>de</strong> la salida impresa. Las bases <strong>de</strong><br />

datos <strong>XML</strong> permiten presentar información estructurada, ya que esta viene <strong>de</strong>finida por las<br />

marcas <strong>de</strong> los distintos archivos.<br />

Documentos <strong>XML</strong><br />

El constructor en un documento <strong>XML</strong> es el elemento. Los documentos <strong>XML</strong> <strong>de</strong>ben <strong>de</strong><br />

tener un único elemento raíz que abarque al resto <strong>de</strong> elementos don<strong>de</strong> los elementos hijos <strong>de</strong>l<br />

elemento raíz se <strong>de</strong>ben anidar a<strong>de</strong>cuadamente. Las representaciones anidadas se usan<br />

ampliamente en las aplicaciones <strong>de</strong> intercambio <strong>de</strong> datos <strong>XML</strong>. Por tanto, la estructura <strong>de</strong><br />

etiquetas anidadas <strong>de</strong>ntro <strong>de</strong> un archivo <strong>XML</strong> hace que se disponga <strong>de</strong> una estructura <strong>de</strong> árbol.<br />

Características <strong>de</strong> los documentos <strong>XML</strong>:<br />

Posee mensajes auto-documentados: no se tiene que consultar un esquema para<br />

compren<strong>de</strong>r el significado <strong>de</strong>l texto.<br />

El formato <strong>de</strong>l documento no es rígido: se pue<strong>de</strong> agregar información adicional tal<br />

como etiquetas<br />

<strong>XML</strong> permite estructuras anidadas: En un mo<strong>de</strong>lo relacional el anidamiento lo<br />

tendríamos que incluir en una tabla aparte, por lo que en bases <strong>de</strong> datos relacionales<br />

esto no era posible<br />

Gran variedad <strong>de</strong> herramientas disponibles para ayudar a su procesamiento

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!