Publicado el 1 de Noviembre del 2019
658 visualizaciones desde el 1 de Noviembre del 2019
522,0 KB
25 paginas
Creado hace 18a (03/07/2006)
BASES DE DATOS
DISTRIBUIDAS
BASES DE DATOS AVANZADAS
DEPARTAMENTO DE INFORMÁTICA
1
MOTIVACIÓN DE LAS BDD
NECESIDAD DE
INTEGRACIÓÓN + DISTRIBUCI
INTEGRACI
N + DISTRIBUCIÓÓNN
Bases de datos
distribuidas
Bases de datos
Redes de
ordenadores
Bases de Datos Avanzadas
Departamento de Informática
2
INTEGRACIÓN
PROBLEMAS DERIVADOS DEL
DESARROLLO DE BD INDEPENDIENTES
Datos redundantes
SGBD distintos
Plataformas variadas (pc’s, workstations)
Consecuencia
Inconsistencias en los datos
Dificultad de interoperatividad
Aislamiento de los distintos grupos de usuarios
Necesidad de Sistemas de Información integrados que respondan
a los objetivos globales de la empresa
Bases de Datos Avanzadas
Departamento de Informática
3
DISTRIBUCIÓN
FINALIDAD
Acercar la informática a los usuarios
Compartiendo
Optimizando
Necesidad de Sistemas de Información Distribuidos que doten de
autonomía a los usuarios y que consigan mayor eficiencia
Bases de Datos Avanzadas
Departamento de Informática
4
NO OBSTANTE…
INTEGRACIÓN
=
CENTRALIZACIÓN
Bases de Datos Avanzadas
Departamento de Informática
5
DEFINICIONES
BASES DE DATOS DISTRIBUIDAS (BDD)
Colección de múltiples bases de datos, lógicamente
interrelacionadas, distribuidas sobre una red de ordenadores
SISTEMA DE GESTIÓN DE BDD (SGBDD)
Producto software capaz de gestionar una BDD,
suministrando mecanismos de acceso que hacen
transparente la distribución
SISTEMA DE BDD = BDD + SGBDD
Bases de Datos Avanzadas
Departamento de Informática
6
BASES DE DATOS DISTRIBUIDAS
Bases de Datos Avanzadas
Departamento de Informática
7
CARÁCTERÍSTICAS DE LAS BDD
Los datos deben estar físicamente en más de un ordenador (distintas
sedes)
Las sedes deben estar interconectadas mediante una red (cada sede es un
nodo de la red)
Los datos han de estar lógicamente integrados (recuperación y
actualización) tanto en local como remoto (esquema lógico global y
único)
En una única operación se puede acceder (recuperar o actualizar) datos
que se encuentran en más de una sede (acceso a datos locales o
remotos)
Todas las acciones que necesiten realizarse sobre más de una sede serán
transparentes al usuario (transparencia de distribución para el usuario)
Bases de Datos Avanzadas
Departamento de Informática
8
ALMACENAMIENTO DISTRIBUIDO
Dada una relación R:
RÉPLICA: copia de R en emplazamiento diferente
FRAGMENTACIÓN: R dividida en fragmentos
diferentes almacenados en sitios diferentes
RÉPLICA Y FRAGMENTACIÓN: R dividida en
fragmentos que son replicados en sitios diferentes
Bases de Datos Avanzadas
Departamento de Informática
9
VENTAJAS DE LAS BDD (I)
ORGANIZATIVAS:
Adaptación a la organización de la institución (unión de
compañías/descentralización), respondiendo a cambios
Almacenar los datos donde son generados y/o usados, la
mayor parte locales
Proporcionar autonomía local, controlándose desde cada
nodo. Política general contra política local
ECONÓMICAS:
Costes de comunicación y de creación de pequeños
sistemas
Bases de Datos Avanzadas
Departamento de Informática
10
VENTAJAS DE LAS BDD (y II)
TÉCNICAS:
Flexibilidad, acceso desde distintos lugares y por
distintas personas a la vez
Fiabilidad/disponibilidad, en un determinado
momento / intervalo. Varios sitios, duplicaciones,
evitan fallos
Modularidad
Mejora del rendimiento, BD más pequeñas,
operaciones de menor volumen
Crecimiento incremental, añadiendo poder de
procesamiento y almacenamiento
Bases de Datos Avanzadas
Departamento de Informática
11
DESVENTAJAS DE LAS BDD
Complejidad del sistema, desarrollo de software más
costoso, problemas de sincronización, dificultad para
conocer la corrección de los algoritmos paralelos,
detección de caídas de nodos
Dependencia de la red de comunicaciones, sobrecarga de
procesamiento de mensajes
Dificultad de diseño, fases adicionales
Poca madurez de los productos comerciales, orientados a
replicación
Funciones de administración compleja, sincronización y
coordinación
Dificultad de cambio, inexistencia de metodologías
Personal especializado
Bases de Datos Avanzadas
Departamento de Informática
12
COMPONENTES DE UNA BDD
BD locales
SGBDD
Red de comunicaciones
Diccionario o directorio global
Bases de Datos Avanzadas
Departamento de Informática
13
EL SGBDD (I)
Las RESPONSABILIDADES del SGBDD serán:
Transparencia de red
Transparencia de fragmentación
Transparencia de copias o duplicación
Propagación de actualizaciones
Procesamiento de consultas distribuidas, definición de estrategias
Mantener un diccionario integrado
Control de concurrencia, integridad de la BDD, consistencia entre
las múltiples copias de los datos
Fiabilidad de los SGBDD, capaz de recuperar y devolver a las bases
de datos implicadas en el fallo un estado consistente y estable
Soporte de sistema operativo
Bases de datos heterogéneas, mecanismos de traducción
Bases de Datos Avanzadas
Departamento de Informática
14
EL SGBDD (y II)
Un SGBDD tiene, conceptualmente, tres
COMPONENTES principales
Procesador de datos locales (PDL)
Gestión de datos local
Procesador de aplicaciones distribuidas (PAD)
Responsable de las funciones de distribución
Software de comunicaciones
Suministra las primitivas y los servicios de comunicaciones
que necesita el PAD
Cada sede puede tener un PDL y un PAD o bien
sólo uno de ellos
Bases de Datos Avanzadas
Departamento de Informática
15
TIPOLOGÍA DE LAS BDD
SEGÚN EL GRADO DE HOMOGENEIDAD DE LOS SGBD
LOCALES:
SGBDD homogéneos: todos los SGBD locales son iguales
SGBDD heterogéneos: los SGBD locales son distintos
SEGÚN EL GRADO DE AUTONOMÍA FUNCIONAL:
SGBDD federados: total autonomía funcional (multibase de
datos)
SGBDD sin ninguna autonomía funcional local
SEGÚN EL GRADO DE AUTONOMÍA ORGANIZATIVA:
Autonomía total: las decisiones se toman a nivel local
Organización centralizada
Bases de Datos Avanzadas
Departamento de Informática
16
ESQUEMAS DE UNA BDD
Usuarios
de la BDD
Esquemas locales y esquema global
Diccionario global integrado
Bases de Datos Avanzadas
Departamento de Informática
17
DISEÑO DE BDD – ESTRATEGIAS
TOP-DOWN (descendente)
En un principio el diseño no existe.
Diseñador necesita identificar tablas, pero
también su ubicación y la necesidad de
replicación.
BOTTOM-UP (ascendente)
Cuando existen diseños previos.
Integración de esquemas existentes (ELL) al
esquema global (ELG).
Bases de Datos Avanzadas
Departamento de Informática
18
DISEÑO DE BDD –
FRAGMENTACIÓN (I)
RAZONES PARA FRAGMENTAR
Encontrar unidad de distribución más adecuada.
Disminuir cantidad de accesos remotos.
Incrementar el nivel de concurrencia.
DESVENTAJAS
Degradación del rendimiento.
Complejidad de mantenimiento de la integridad
referencial.
Bases de Datos Avanzadas
Departamento de Informática
19
DISEÑO DE BDD –
FRAGMENTACIÓN (II)
CORRECCIÓN EN LA FRAGMENTACIÓN
Completitud
a algún Rj
" di
Reconstrucción
˛ FR
R = Ri, " Ri
Disyunción
Frag horizontal : R1, R2, …, Rn, el dato di está en Rj y sólo en
Rj
Frag vertical: sólo se repiten atributos clave
Bases de Datos Avanzadas
Departamento de Informática
20
˛
DISEÑO DE BDD –
FRAGMENTACIÓN (III)
TIPOS DE FRAGMENTACIÓN
HORIZONTAL
Divide la relación en subconjuntos de tuplas.
Operador SELECCIÓN: s
Primaria y Derivada
Recuperación mediante UNION.
Ci (R)
VERTICAL
Divide la relación verticalmente en columnas.
Operación PROYECCIÓN: P
Agrupamiento y División.
Recuperación mediante JOIN.
Li (R)
HÍBRIDA
Mezcla de fragmentación vertical y horizontal.
Recuperación mediante UNION y JOIN.
Bases de Datos Avanzadas
Departamento de Informática
21
DISEÑO DE BDD –
FRAGMENTACIÓN (y IV)
RESULTADO: ESQUEMA DE
FRAGMENTACIÓN
Conjunto de fragmentos que incluye todos los
atributos y tuplas de la BD original.
La BD completa puede reconstruirse mediante
UNION y JOIN.
Expresado en álgebra relacional.
Bases de Datos Avanzadas
Departamento de Informática
22
s
s
s
P
P
P
DISEÑO DE BDD – ASIGNACIÓN (I)
Búsqueda de distribución óptima de los fragmentos
Fi en los nodos Si.
Características deseables:
Coste mínimo
Almacenamiento
Comunicación
Máximo rendimiento:
Tiempos de respuesta mínimos
Capacidad de procesamiento máxima
Depende del tipo y frecuencia de transacciones.
Existen algoritmos de asignación que buscan
distribución óptima.
Bases de Datos Avanzadas
Departamento de Informática
23
DISEÑO DE BDD – ASIGNACIÓN (y II)
RESULTADO: ESQUEMA DE ASIGNACIÓN
Correspondencia sitios - fragmentos de la BD.
Si un fragmento se encuentra en más de un sitio,
el fragmento está replicado.
Bases de Datos Avanzadas
Departamento de Informática
24
DISEÑO DE BDD – REPLICACIÓN (I)
RAZONES PARA REPLICAR:
Mejorar el rendimiento en la recuperación de
consultas globales.
DESVENTAJAS:
Actualización de réplicas.
ESTRATEGIAS:
Replicación total.
Asignación no redundante.
Replicación parcial.
Bases de Datos Avanzadas
Departamento de Informática
25
DISEÑO DE BDD – REPLICACIÓN (y II)
RESULTADO: ESQUEMA DE
REPLICACIÓN
Descripción de la replicación de los fragmentos
ENFOQUES:
Consultas de los datos en múltiples sitios: se
replica.
Número de actualizaciones elevado: no se
replica.
Bases de Datos
+
Comentarios de: Bases de Datos Distribuidas (0)
No hay comentarios