Publicado el 25 de Agosto del 2017
782 visualizaciones desde el 25 de Agosto del 2017
982,6 KB
64 paginas
Creado hace 18a (18/06/2006)
IBM DB2 OLAP SERVER
Procesamiento Analítico en Línea
IBARRA MARIA DE LOS ANGELES
2006
Índice
Introducción
Data warehouse
Data mart
Sistemas OLTP
Sistemas OLAP
Operaciones analíticas básicas
Vista de datos
Modelo de datos
Utilidades de OLAP
Beneficios de OLAP
Índice
Presentación del producto
Centro de depósitos
Definir área temática
Definir fuente de depósito
Definir destino de depósito
Definir movimiento y transformación de datos
Definir esquema estrella
Análisis modelo Multidimensional
Creación del modelos OLAP
Creación de un metaperfil
Creación de una Aplicación OLAP
Introducción
Estructura Multidimencional
Estructura Multidimencional
En contraste con las bases de datos relacionales, las
multidimensionales están compuestas por dimensiones que
son atributos estructurales de un cubo, organizadas con
jerarquías de categorías que describen los datos en tablas.
Por ejemplo se tienen las ventas de cada producto por región.
Una compañía tiene tres productos (arandelas, tornillos,
tuercas) que se venden en tres territorios (Este, Oeste,
Central).
Introducción
Un camino para representar esta tabla en una forma mas
óptima es a través de una matriz de dos dimensiones.
De esta forma se pueden realizar preguntas como ¿Cuáles
fueron las ventas de arandelas en el Este?, ¿Cuáles fueron
las ventas de Tornillos en el Oeste?.
Data Warehouse
Definicióón:n: Conjunto de datos orientados a temas integrado,
Definici
no volátil de tiempo variante que se usa para el soporte del
proceso de toma de decisiones gerenciales.
Orientado hacia la información relevante de la Organización
Se diseña para consultar eficientemente información relativas
a las actividades básicas de la organización como ser,
comparas, ventas, etc.
Data Warehouse
Datos Integrados
Integra datos recolectados de diferentes sistemas operacionales de
la organización y o fuentes externas.
Data Warehouse
Data Warehouse
Variable en el Tiempo
Los datos son relativos a un periodo de tiempo y estos deben
ser integrados periódicamente, los mismos son almacenados
como fotos que se corresponden a un periodo de tiempo.
Data Warehouse
No Volátil
Los datos que son almacenados no sufren ninguna
actualización solo son incrementados. El periodos cubierto
para un DW va de 2 a 10 años.
Data Marts
Problema: al crecer el D.W. El rendimiento de las consultas
Problema:
decae y el modelo centralizado deja de ser óptimo.
Solucióón:n: crear almacenes de datos especializados por área,
Soluci
que reciben los datos desde el almacén centralizado, estos
almacenes se conocen como Data Marts.
Ventajas: al usar menos usuarios se lo puede optimizar para
Ventajas:
recuperar más rápidamente los datos que necesitan.
Existen dos tipos de Data Marts:
Dependientes: los datos son extraídos del D.W.
Independientes: los datos son extraídos de los sistemas
operacionales.
Sistemas OLTP
Definicióón:n: procesan las transacciones en tiempo real de un
Definici
negocio.
Desventaja: proporciona capacidades limitadas para la toma
de decisiones.
Sistemas OLAP
Definicióón:n: los datos son clasificados en diferentes dimensiones
Definici
y pueden ser vistas unas con otras en diferentes
combinaciones para obtener diferentes análisis de los datos
que contienen.
En este modelos los datos son vistos como cubos los cuales
consisten en categorías descriptivas (dimensiones) y valores
cuantitativos (medidas).
El modelo multidimensional de datos simplifica a los
usuarios formular consultas complejas, arreglar datos en un
reporte, cambiar de datos resumidos a datos detallados,
etc.
Operaciones Analíticas Básicas
Consolidación: este comprende el conjunto de datos. Esto
puede involucrar acumulaciones simples o agrupaciones
complejas que incluyen datos interrelacionados.
Drill-Down: OLAP puede moverse en la dirección contraria y
presentar automáticamente datos detallados que abarcan
datos consolidados.
Slicing and Dicing: se refiere a la capacidad de visualizar a
la BD desde diferentes puntos de vista.
Operaciones Analíticas Básicas
Vista de Datos
La vista de datos como cubos es una extensión de la manera
normal en que los usuarios de negocios interactúan con los
datos.
Por Ejemplo: la mayoría de los usuarios desearía ver como se
desarrollan las ventas a lo largo del tiempo . Para ello se
necesitaría ver varías planillas de cálculo.
Vista de Datos
Vista de Datos
Debido a su representación pueden ser tomadas rebanadas de
datos de las mismas, para responder diversas preguntas.
Modelos de Datos
MOLAP: en estos sistemas los datos se encuentran
MOLAP:
almacenados en una estructura de datos multidimencional
(OLAP Multidimensional).
Ventajas:
Desventajas:
Mayor performance en el
procesamiento de queries.
Tamaño limitado para la arquitectura del
cubo.
Poco tiempo de cálculo realizado en el
momento.
No puede acceder a datos que no están
en el cubo.
Puede escribir sobre la base de datos.
No puede explotar el paralelismo en de
las Bases de Datos.
Posibilita hacer cálculos más
complicados.
Modelos de Datos
ROLAP: son sistemas en los cuales los datos se encuentran
ROLAP:
almacenados en una base de datos relacional (OLAP
Relacional).
Ventajas:
Desventajas:
Uso total de la seguridad e integridad de la
base de datos .
Queris más lentos.
Escalable para grandes volúmenes.
Los datos puede ser compartida con
aplicaciones SQL.
Datos y estructura más dinámicos.
Construcción cara.
Los cálculos están limitados a las
funciones de las bases de datos.
Modelos de Datos
HOLAP: estos sistemas mantienen los registros detallados
en la base de datos relacional, mientras que los datos
resumidos o agregados se almacenan en una base de datos
Multidimensional separada.
Son conocidos como Híbridos debido a que contiene las
características de los sistemas anteriores.
Comparaciones
Con MOLAP: los datos son precalculados y luego son
almacenados en cubos de datos multidimensionales.
Con ROLAP: los datos son accedidos directamente desde el
D.W. u otra fuente de datos relacional y no son almacenados
por separado.
Con HOLAP: Mantiene los volúmenes de datos más grande en
la base de datos relacional y las agregaciones en una base de
datos MOLAP separada.
Utilidades
Tienen acceso a grandes cantidades de datos.
Analizan las relaciones entre muchos tipos de elementos
empresariales.
Involucran datos agregados.
Comparan datos agregados a través de periodos
jerárquicos.
Presentan los datos en diferentes perspectivas.
Involucran cálculos complejos entre elementos de datos.
Pueden responder con rapidez a consultas de usuarios.
Beneficios
Es de fácil uso y acceso flexible para los usuarios.
Los datos están organizados en diferentes dimensiones los
que permite un mejor análisis.
Ahorro generado por productividad de personas altamente
profesionales.
Permite encontrar la historia en los datos.
Genera ciertas ventajas competitivas.
Presentación del Producto
Vamos a realizar los siguientes pasos:
CREAR UN DEPOSITO DE DATOS
Definición de área temática.
Definición de fuente de depósito.
Definición de destino de depósito.
Definición de movimiento y transformación de datos.
Definición de proceso.
Definición de esquema estrella.
Exportación del esquema estrella.
Presentación del Producto
ANALISIS MODELO MULTIDIMENSIONAL
Creación del modelo OLAP.
Selección de la tabla de hechos.
Creación de dimensiones.
Unión de las tablas de mediciones.
Creación de Herencia.
Guardar modelo OLAP.
Creación un metaperfil.
Iniciar asistente.
Seleccionar un modelo olap en el que basar el
metaperfil.
Creación de una aplicación OLAP.
Definición de un Área Temática
En primer lugar se debe crear una BD para que contenga los
datos para el depósito. Luego, esta debe ser registrada con el
ODBC.
Se utiliza el Centro de depósito de datos para definir un área
temática.
Un área temática identifica y agrupa procesos relativos a
un área lógica de la empresa.
Definición de un Área Temática
Definición de Fuente de Depósito
Las fuentes de depósito son las definiciones lógicas de las
tablas y archivos que proporcionarán datos a la tabla de
mediciones.
El centro de depósito de datos utiliza las especificaciones de
las fuentes de depósito para acceder a los datos y
seleccionarlos.
Definición de Fuente de Depósito
Se puede utilizar más de una fuente en un proceso.
Definición de Fuente de Depósito
Definición de Destino de Depósito
Los Destinos de depósito identifican la base de datos y las tablas
que el Centro de depósito de datos debe utilizar para el depósito
de datos.
Normalmente, las tablas de destino que se definen en el destino de
depósito también se utilizan como tablas de mediciones y de
hechos del esquema en estrella.
Sin embargo, el destino de depósito puede incluir también tablas
de destino intermedias que se utilizan para la transformación de
datos.
Definición de Destino de Depósito
Definición de Movimiento y
Transformación de Datos
Se debe definir el modo en que el Centro de depósito de datos
debe mover y transformar datos para darles un formato
adecuado para el depósito de los mismos.
En primer lugar, se define un proceso que contenga una
Comentarios de: IBM DB2 OLAP SERVER (0)
No hay comentarios