BASES DE DATOS ORACLE

http://www.redcientifica.com/oracle/


Administración y Optimización de Bases de Datos Oracle
Copyright 1999-2004 Manuel de la Herrán Gascón

Conceptos de Bases de Datos Multidimensionales

Concepto

Descripción

BDR

Base de Datos Relacional. Sistema de almacenamiento de datos basado en un conjunto de tablas unidas mediante relaciones.

BDM

Base de datos Multidimensional. Base de datos de estructura basada en dimensiones orientada a consultas complejas y alto rendimiento. Puede utilizar un SGBDR en estrella (Base de datos Multidimensional a nivel lógico) o SGBDM (Base de datos Multidimensional a niveles lógico y físico o Base de datos Multidimensional Pura)

OLTP

On Line Transactional Processing. Procesamiento Transaccional En Línea. Se trata de los procesos clásicos de tratamiento automático de información, que incluyen Altas, Bajas, Modificaciones y Consultas.

OLAP

On Line Analytical Processing. Procesamiento Analítico En Línea. Se trata de procesos de análisis de información. Estos sistemas están orientados al acceso en modo consulta.

DW

DataWarehouse. Sistema almacén de datos que reúne la información generada por los distintos departamentos de una organización. Pretende conseguir que cualquier departamento pueda acceder a información de cualquiera de los otros mediante un único medio, así como obligar a que los mismos términos tengan el mismo significado para todos. Es un almacen de datos historicos, utilizado por una herramienta OLAP para procesar información, elaborar informes y vistas. También se define como un conjunto de datos orientados por tema, integrados, variables en el tiempo y no volátiles que se emplea como apoyo a la toma de decisiones.

Datamart

Sistema que mantiene una copia de parte de un DataWarehouse para un uso departamental. Almacén de datos historicos relativos a un departamento de una organización, utilizado por una herramienta OLAP para procesar información, elaborar informes y vistas.

EIS

Executive Information Systems. Sistemas de información para directivos.

DSS

Decision Support System. Sistema de ayuda a la toma de decisiones.

Data Mining

Proceso no trivial de análisis de grandes cantidades de datos con el objetivo de extraer información útil. Por ejemplo, se trata de aplicar algoritmos de clasificación de datos para realizar predicciones futuras, o estudios de correlación entre variables aparentemente independientes. Para ello, es común la utilización de Redes Neuronales o Algoritmos Evolutivos.

KDD

Knowdledge Discovery in Databases.

Rotación

Cambio de dimensiones en un informe.

Drill Down

Descomponer (visualmente) en detalle un dato según una jerarquía de una dimensión.

Drill Up

Agregar (visualmente) un dato según una jerarquía de una dimensión.

Roll Up

Proceso que calcula para un indicador, y para una o más de las dimensiones por las que ese indicador se mueve, los valores agregados o padres sucesivos a partir de la suma de sus hijos, según las jerarquías especificadas, pudiendo poseer cada dimensión más de una jerarquía. Por ejemplo, es el proceso que suma los ingresos por cada provincia acumulándolos en los ingresos de la comunidad autónoma correspondiente. Se trata de una función que relaciona los valores de dos niveles jerárquicos distintos y adyacentes en una dimensión, transformando un grupo de datos de un nivel en un único dato asignable a otro valor del nivel superior.

Spread

Proceso que produce dentro de una dimensión una progresión o algún tipo de reparto proporcional de la cantidad asignada a un elemento entre otros de acuerdo a algún criterio.

Dimensión

Criterio de clasificación de información. Eje de análisis. Lista de valores que proporciona un índice a los datos. Por ejemplo: <Tiempo>, <Geografía>, <Producto>

Indicador, Medida, Hipercubo, Variable, Fórmula

Objeto de estudio. Cada indicador tiene asociada una serie de dimensiones sobre las que se pueden clasificar sus valores, se dice que se mueve por un cierto número de dimensiones. Por ejemplo, algunos indicadores son:
Ingresos(<Tiempo>, <Geografía>, <Producto>)
Número de Empleados(<Tiempo>, <Geografía>)
Si el indicador contiene datos almacenados se habla de Variable Multidimensional. Si por el contrario, lo que se almacena es la expresión para calcular esos datos a partir de otros (que puede ser una fórmula o un programa), se habla de Fórmula Multidimensional

Elementos de una dimensión

Posibles valores de un eje de análisis. Por ejemplo, "Enero de 1998", "Trimestre 4 de 1998", o "1996" para la dimensión <Tiempo> y "Bilbao", "Andalucía" o "Zona Norte" para la dimensión <Geografía>

Jerarquía

Forma de agrupar todos o sólo algunos de los elementos de una dimensión con relaciones padre-hijo. Casi siempre, pero no obligatoriamente, implican que el padre se calcula como la suma de sus hijos. Una dimensión puede tener cero, una o varias jerarquías.

Relaciones o Atributos

Definen vínculos entre valores de dos dimensiones, de forma que cada valor de una dimensión puede estar relacionado con uno o más valores de otra dimensión

Celda

Estructura mínima de almacenamiento formada por la intersección de un valor de cada una de las dimensiones que componen el cubo. Puede contener o no contener datos

SQL

Structured Query Language. Lenguaje de Consultas Estructurado. "Select Query Language". Lenguaje orientado a la creación de consultas de bases de datos relacionales.

RDBMS

Relational DataBase Management System. Sistema de gestión de bases de datos relacionales. Programa que sirve para crear, diseñar y manipular bases de datos relacionales

OLTP to OLAP

Proceso de migración de datos desde un sistema OLTP a uno OLAP. Esta migración es habitualmentwe el elemento crítico en un desarrollo OLAP

R-OLAP

Arquitectura de Base de Datos Multidimensional en la que los datos se encuentran almacenados en una Base de Datos Relacional, normalmente con en forma de estrella (copo de nieve, araña).

M-OLAP

Arquitectura de Base de Datos Multidimensional en la que los datos se encuentran almacenados en una Base de Datos Multidimensional, que mejora los tiempos de acceso a costa de mayores necesidades de almacenamiento y retardos en las modificaciones.

H-OLAP

Arquitectura que combina las tecnologías ROLAP y MOLAP. En HOLAP, el soporte de almacenamiento de datos y el motor de generación de vistas contienen elementos de ambas tecnologías. Pretende combinar las ventajas de cada una sin sus inconvenientes.

R-OLAP

H-OLAP

M-OLAP

Espacio ocupado

Bajo

Medio

Alto

Velocidad de las consultas

Baja

Media

Alta

Carga de los procesos Batch

Baja

Media

Alta

Cómo pasar de R-OLAP a H-OLAP

  • Redundancia en cuanto a consultas precalculadas
  • Redundancia en descripciones
  • Redundancia en acumulados
  • Índices

Cómo pasar de M-OLAP a H-OLAP

Datamining

  • Detección de situaciones anormales
  • Búsqueda de relaciones ocultas entre variables
  • Máximos, mínimos, situaciones periódicas
  • Comprobación de hipótesis
  • Generación automática y prueba de hipótesis
  • Clusterización, segmentación
  • Predicción del futuro, extrapolación
  • Predicción del pasado, interpolación
  • Modelos What-If
  • Modelización, entrenamiento y predicción

Este curso esta incluido en el CD-ROM de REDcientífica. Solicítalo por correo haciendo click aquí. http://www.redcientifica.com/cdrom/


Enviar un e-mail a Manuel de la Herrán Gascón Buzón de contacto
© 1999-2004 Manuel de la Herrán Gascón
Volver a la página anteriorIr a la página principalIr a la página siguiente5/6