Funcionalidad 4: Almacenes de Datos y Bases de Datos XML ...

Funcionalidad 4: Almacenes de Datos y Bases de Datos XML ... Funcionalidad 4: Almacenes de Datos y Bases de Datos XML ...

alarcos.inf.cr.uclm.es
from alarcos.inf.cr.uclm.es More from this publisher
13.08.2013 Views

MMAABBDD Funcionalidad 4: Almacenes de Datos y Bases de Datos XML 4 No volátil: Únicamente hay dos tipos de operaciones en el DW: la carga de los datos procedentes de los entornos operacionales (carga inicial y carga periódica) y la consulta de los mismos. La actualización de datos no forma parte de la operativa normal de un DW. Histórico: El tiempo debe estar presente en todos los registros contenidos en un DW. Las bases de datos operacionales contienen los valores actuales de los datos, mientras que los DW contienen información actual y resúmenes de esta en el tiempo. Diseño y Construcciones Existen actualmente 2 tendencias en cuanto al diseño de almacenes de datos: Diseño directo (“en estrella”) de estructuras lógicas de datos (sobre el modelo relacional). Utilización de una etapa previa basada en un modelo conceptual, de forma análoga al diseño de bases de datos. 1. Diseño en Estrella Este método se basa en el “esquema en estrella”, que consiste en un modelo asimétrico con una tabla grande dominante en el centro del esquema, que se encarga de conectar las otras tablas. Figura 1. Ejemplo de diseño en estrella. El esquema en estrella básico tiene 4 componentes: hechos, dimensiones, atributos y jerarquías de atributo. Cada uno de estos componentes se describe a continuación: Los hechos son mediciones numéricas que representan un aspecto o actividad de negocio específica. Por ejemplo, las cifras de ventas. Las dimensiones son características calificadoras que proporcionan perspectivas adicionales de un hecho dado. Por ejemplo, las ventas podrían compararse por producto de una región a otra.

MMAABBDD Funcionalidad 4: Almacenes de Datos y Bases de Datos XML 5 Cada tabla de dimensiones contiene atributos. Con frecuencia se utilizan los atributos para buscar, filtrar o clasificar hechos. Por consiguiente, el diseñador del almacén de datos debe definir atributos de negocio comunes que serán utilizados por el analista de datos para limitar una búsqueda, agrupar información o describir dimensiones. Si seguimos utilizando un ejemplo de ventas tendríamos: o Dimensión producto: ID del producto, descripción, tipo de producto, etc. o Dimensión ubicación: región, estado, ciudad y número de tienda. o Dimensión tiempo: año, trimestre, mes, semana, etc. Los atributos dentro de las dimensiones pueden ordenarse en una jerarquía bien definida. La jerarquía de atributos proporciona una organización descendente que se utiliza para dos propósitos principales: agregación, análisis de datos con mayores y menores niveles de agregación. 1.1. Tablas Factuales y Dimensionales Tabla Factual: Es la tabla central que contiene los datos (hechos) sobre las diferentes combinaciones de las dimensiones. Su clave primaria se crea combinando las claves primarias de sus dimensiones relacionadas. Puede suceder que la tabla factual no tenga hechos y que se utilice simplemente para registrar las relaciones entre las diferentes dimensiones. Dimensiones: Para cada una de las dimensiones se crea una tabla, almacenado así las descripciones de las dimensiones. Los atributos de las tablas dimensionales son textuales, discretas y se utilizan para restricciones y cabeceras de filas en el conjunto de respuesta del usuario. 2. Modelo Conceptual de Almacenes de Datos 2.1. Metodología para el Diseño de Almacenes de Datos de Golfarelli y rizzi Consta de siete fases: 1. Análisis y reconciliación de las fuentes de datos. En esta fase se analizan los esquemas locales y se normalizan para posteriormente integrase. 2. Análisis de requisitos, mediante entrevistas y reuniones coordinadas con los usuarios de datamart. 3. Modelado conceptual, para el que proponen el modelo factual dimensional. Este está compuesto por varios esquemas de hechos.

MMAABBDD <strong>Funcionalidad</strong> 4:<br />

<strong>Almacenes</strong> <strong>de</strong> <strong>Datos</strong> y <strong>Bases</strong> <strong>de</strong> <strong>Datos</strong> <strong>XML</strong><br />

5<br />

Cada tabla <strong>de</strong> dimensiones contiene atributos. Con frecuencia se utilizan los<br />

atributos para buscar, filtrar o clasificar hechos. Por consiguiente, el diseñador <strong>de</strong>l<br />

almacén <strong>de</strong> datos <strong>de</strong>be <strong>de</strong>finir atributos <strong>de</strong> negocio comunes que serán utilizados<br />

por el analista <strong>de</strong> datos para limitar una búsqueda, agrupar información o <strong>de</strong>scribir<br />

dimensiones. Si seguimos utilizando un ejemplo <strong>de</strong> ventas tendríamos:<br />

o Dimensión producto: ID <strong>de</strong>l producto, <strong>de</strong>scripción, tipo <strong>de</strong> producto, etc.<br />

o Dimensión ubicación: región, estado, ciudad y número <strong>de</strong> tienda.<br />

o Dimensión tiempo: año, trimestre, mes, semana, etc.<br />

Los atributos <strong>de</strong>ntro <strong>de</strong> las dimensiones pue<strong>de</strong>n or<strong>de</strong>narse en una jerarquía bien<br />

<strong>de</strong>finida. La jerarquía <strong>de</strong> atributos proporciona una organización <strong>de</strong>scen<strong>de</strong>nte que<br />

se utiliza para dos propósitos principales: agregación, análisis <strong>de</strong> datos con mayores<br />

y menores niveles <strong>de</strong> agregación.<br />

1.1. Tablas Factuales y Dimensionales<br />

Tabla Factual: Es la tabla central que contiene los datos (hechos) sobre las diferentes<br />

combinaciones <strong>de</strong> las dimensiones. Su clave primaria se crea combinando las claves primarias<br />

<strong>de</strong> sus dimensiones relacionadas. Pue<strong>de</strong> suce<strong>de</strong>r que la tabla factual no tenga hechos y que se<br />

utilice simplemente para registrar las relaciones entre las diferentes dimensiones.<br />

Dimensiones: Para cada una <strong>de</strong> las dimensiones se crea una tabla, almacenado así las<br />

<strong>de</strong>scripciones <strong>de</strong> las dimensiones. Los atributos <strong>de</strong> las tablas dimensionales son textuales,<br />

discretas y se utilizan para restricciones y cabeceras <strong>de</strong> filas en el conjunto <strong>de</strong> respuesta <strong>de</strong>l<br />

usuario.<br />

2. Mo<strong>de</strong>lo Conceptual <strong>de</strong> <strong>Almacenes</strong> <strong>de</strong> <strong>Datos</strong><br />

2.1. Metodología para el Diseño <strong>de</strong> <strong>Almacenes</strong> <strong>de</strong> <strong>Datos</strong> <strong>de</strong> Golfarelli y rizzi<br />

Consta <strong>de</strong> siete fases:<br />

1. Análisis y reconciliación <strong>de</strong> las fuentes <strong>de</strong> datos. En esta fase se analizan los<br />

esquemas locales y se normalizan para posteriormente integrase.<br />

2. Análisis <strong>de</strong> requisitos, mediante entrevistas y reuniones coordinadas con los<br />

usuarios <strong>de</strong> datamart.<br />

3. Mo<strong>de</strong>lado conceptual, para el que proponen el mo<strong>de</strong>lo factual dimensional. Este<br />

está compuesto por varios esquemas <strong>de</strong> hechos.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!